SlideShare a Scribd company logo
1 of 82
Министерство образования и науки
          Российской Федерации
  Рыбинская Государственная Авиационная
        Технологическая Академия




    Конспект лекций по
   дисциплине «Системы
искусственного интеллекта»
         Кафедра МПО ЭВС
               Осипов Г.С.




                                          1
Оглавление
Предисловие
Лекция 1. Место среди других наук, первые шаги и современные направления искусственного
          интеллекта
          1.1.  Представление знаний
          1.2.  Автоматизация рассуждений
          1.3.  Приобретение знаний, машинное обучение и автоматическое порождение гипотез
          1.4.  Интеллектуальный анализ данных и обработка образной информации
          1.5.  Многоагентные системы, динамические интеллектуальные системы и планирование
          1.6.  Обработка естественного языка, пользовательский интерфейс и модели пользователя
          1.7.  Нечеткие модели и мягкие вычисления
          1.8.  Разработка инструментальных средств
Лекция 2. Формальные языки и формальные системы
          2.1.  Язык исчисления предикатов первого порядка
          2.2.  Исчисление предикатов первого порядка
          2.3.  Формальные и алгебраические системы
          2.4.  Интерпретация. Выводимость и истинность
Лекция 3. Представление знаний. Системы, основанные на правилах, или продукционные системы
          3.1.  Правила для представления знаний
          3.2.  Рабочая память
          3.3.  Стратегии управления
          3.4.  Разрешение конфликтного множества правил
          3.5.  Пример
Лекция 4. Представление знаний. Cемантические сети и системы фреймов
          4.1.  Простые и расширенные семантические сети
          4.2.  Универсум Эрбрана и семантические сети
          4.3.  Неоднородные семантические сети
          4.4.  Отношения структурного сходства, асоциативные и каузальные отношения
          4.5.  Совместность событий
          4.6.  Представление знаний в системах фреймов
Лекция 5. Рассуждения. Автоматизация дедуктивных рассуждений
          5.1.  Достоверные и правдоподобные рассуждения
          5.2.  Автоматизация дедуктивных рассуждений. Поиск доказательств теорем методом
                резолюций
          5.3.  Метод резолюций для исчисления высказываний
Лекция 6. Автоматизация дедуктивных рассуждений. Метод резолюций для исчисления предикатов
          первого порядка
          6.1.  Подстановки
          6.2.  Унификация
          6.3.  Алгоритм унификации. Примеры
Лекция 7. Правдоподобные рассуждения. Автоматизация индуктивных расуждений
          7.1.  Понятие квазиаксиоматической теории
          7.2.  ДСМ -- метод индуктивного вывода
Лекция 8. Правдоподобные рассуждения. Автоматизация аргументационных рассуждений и
          рассуждений на основе прецедентов
          8.1.  Аргументация
          8.2.  Алгоритм MIRAGE
          8.3.  Рассуждения на основе прецедентов
Лекция 9. Методы планирования поведения. Поиск плана в пространстве состояний
          9.1.  Планирование как поиск доказательства теорем

                                                                                              2
9.2.   Планирование в пространстве состояний
Литература




       Лекция 1. Место среди других наук, первые шаги и современные направления
искусственного интеллекта.
       Первые исследования,          относящиеся к искусственному интеллекту были
предприняты почти сразу же после появления первых вычислительных машин в начале
50-х годов 20 века.


                                                                                3
Основной целью исследований в искусственном интеллекте является получение
методов, моделей и программных средств, позволяющих искусственным устройствам
реализовать целенаправленное поведение и разумные рассуждения. Таким образом,
научная дисциплина под названием «искусственный интеллект»        входит в комплекс
компьютерных наук, а создаваемые на основе её результатов технологии относятся к
информационным технологиям.
      Особенность задач, к которым следует применять методы этой научной
дисциплины, состоит в том, что в большинстве случаев, до получения результата решения
задачи не известен алгоритм её решения. Алгоритмы решения таких задач являются,
обычно, одним из результатов их решения. Например, алгоритм доказательства теоремы
можно извлечь из её доказательства.

      Человек решает задачи такого рода, используя, в числе прочего, свои знания и
компетентность. Это означает, что одним из важнейших направлений искусственного
интеллекта является разработка механизмов переноса компетентности - обучения
искусственных устройств (или, как принято говорить, приобретения знаний). При этом
считается, что результаты решения задач и сам ход решения должны быть транспарентны
– «прозрачны» для человека и допускать объяснение.

      Таким образом, важной характеристикой представления результатов и хода
решения задач искусственного интеллекта является их, в значительной степени,
вербальный характер.
      Создавая те или иные начальные компьютерные представления и модели,
исследователь или разработчик сравнивает их поведение между собой и с примерами
решения тех же задач специалистом в соответствующей области, модифицирует их на
основе этого сравнения, пытаясь добиться лучшего соответствия результатов. Таким
образом, искусственый интеллект представляет собой экспериментальную науку.
      Чтобы модификация программ улучшала результаты их работы, надо иметь
разумные исходные представления и модели. Такие представления и модели доставляют
исследования в области когнитивных наук.
      Впервые об искусственном интеллекте заговорили в в 1954 году, когда
американский исследователь А.Ньюэлл (A.Newel) решил написать программу для игры в
шахматы. Этой идеей он поделился с аналитиками корпорации «РЭНД» Дж. Шоу (J.Show)
и Г.Саймоном (H.Simon), которые предложили Ньюэллу свою помощь. В качестве
теоретической основы такой программы было решено использовать метод, предложенный
в 1950 году Клодом Шенноном (К. Shannon), основателем теории информации. Точная


                                                                                    4
формализация этого метода была выполнена Аланом Тьюрингом (Alan Turing). Он же
промоделировал его вручную.

         В настоящее время разработка и реализация экспертных систем превратилась в
инженерную       дисциплину.   Научные     же    исследования      сосредоточены    в   ряде
сформировавшихся и формирующихся направлений, некоторые из которых перечислены
ниже.


         1. Представление знаний.
         Представление   знаний     (knowledge   representation)    -   одно   из   наиболее
сформировавшихся направлений искусственного интеллекта. Традиционно к нему
относилась разработка формальных языков и программных средств для отображения и
описания так называемых когнитивных структур1. Сегодня к представлению знаний
причисляют также исследования по         дескриптивной логике, логикам пространства и
времени, онтологиям.


         2. Автоматизация рассуждений
         Автоматизация рассуждений, помимо автоматизации дедуктивных рассуждений,
включает: автоматизацию индуктивных рассуждений, автоматизацию рассуждений на
основе прецедентов (case-based reasoning, CBR), на основе аргументации, на основе
ограничений, автоматизацию рассуждений с неопределенностью, рассуждения о
действиях и изменениях, автоматизацию немонотонных рассуждений и др. Остановимся
кратко на некоторых из них.
         Рассуждения на основе прецедентов.
         Здесь главные проблемы – "фокусировка поиска" на использовании прошлого
опыта,     оценка сходства прецедентов, поиск алгоритмов адаптации прецедентов            и
технологии визуализации.
         Пусть задано множество прецедентов как множество пар <СЛУЧАЙ, РЕШЕНИЕ>,
множество зависимостей между различными атрибутами СЛУЧАЕВ и РЕШЕНИЙ, а
также целевая проблема ЦЕЛЬ. Для возникающей новой ситуации («нового случая»)
требуется найти пару <НОВЫЙ СЛУЧАЙ, ИСКОМОЕ РЕШЕНИЕ>, которая решает
целевую проблему.




1
 Структур человеческого сознания, отражающих представление личности о
действительности
                                                                                           5
Автоматизация рассуждений на основе ограничений
      Наиболее интересны здесь задачи моделирования рассуждений, основанных на
процедурных динамических ограничениях. Они мотивированы сложными актуальными
задачами – например, планированием в реальной обстановке. Решение ищется в области
значений, удовлетворяющих заданные ограничения.

      Под задачей удовлетворения ограничений понимается четверка множеств:
множество переменных, множество соответствующих областей переменных, множество
ограничений на переменные и множество отношений над областями. Решением проблемы
удовлетворения ограничений называется набор значений переменных, удовлетворяющих
ограничениям на переменные, такой, что при этом области, которым принадлежат эти
значения, удовлетворяют отношениям над областями.

      Задача удовлетворения динамических ограничений есть последовательность задач
удовлетворения ограничений, в которой каждая последующая задача есть ограничение
предыдущей. Эти задачи по смыслу близки задачам динамического программирования.
Они связаны также с интервальной алгеброй.


      Немонотонные рассуждения
      К немонотонным рассуждениям относятся исследования по логике умолчаний
(default logic), по логике   "отменяемых" (Defeasible) рассуждений, логике программ,
теоретико - аргументационой характеризации логик с отменами, характеризации логик с
отношениями предпочтения, построению эквивалентных множеств формул для логик с
очерчиванием (circumscription) и некоторые другие. Такого рода модели возникают при
реализации индуктивных рассуждений, например, по примерам; связаны они также с
задачами машинного обучения и некоторыми иными задачами. В частности, в задачах
моделирования рассуждений на основе индукции источником первоначальных гипотез
служат примеры. Если некоторая гипотеза Н возникла на основе       N положительных
примеров (например, экспериментального характера), то никто не может дать гарантии,
что в базе данных или в        поле зрения алгоритма не окажется N+1 - й пример,
опровергающий гипотезу (или меняющий степень ее истинности). Это означает, что
ревизии должны быть подвержены и все следствия гипотезы H.
      Рассуждения о действиях и изменениях
Большая часть работ в этой области посвящена применениям ситуационного исчисления -
формализма, предложенного Джоном Маккарти в 1968 году для описания действий,
рассуждений о них и эффектов действий. Для преобразования плана поведения робота в


                                                                                   6
исполняемую программу, достигающую с некоторой вероятностью фиксированной цели,
вводится специальное логическое исчисление, основанное на ситуационной логике. Для
этой логики предложены    варианты реализации на языке       pGOLOG    - версии языка
GOLOG, содержащей средства для введения вероятностей.
      Активно исследуются логики действий, применение модальных логик для
рассуждений о знаниях и действиях.
      Рассуждения с неопределенностью
В основе таких рассуждений находится использование      байесовского   формализма в
системах правил и сетевых моделях. Байесовские сети – это статистический метод
обнаружения закономерностей в данных. Для этого используется первичная информация,
содержащаяся либо в сетевых структурах        либо в базах данных. Под сетевыми
структурами понимается в этом случае множество вершин и отношений на них,
задаваемое с помощью ребер. Содержательно, ребра интерпретируются как причинные
связи. Всякое множество вершин Z, представляющее все пути между некоторыми двуми
иными вершинами X и Y соответствует условной зависимости между этими двуми
последними вершинами.

                                                         Y




  X



                                                  Z




Далее задается некоторое распределение вероятностей на множестве переменных,
соответствующих вершинам этого графа и полученная, но          минимизированная (в
некотором смысле) сеть называется байсовской сетью.
      На такой сети можно использовать так называемый байесовский вывод, т.е. для
вычисления вероятностей следствий событий можно использовать (с некоторой натяжкой)
формулы теории вероятностей. Иногда     рассматриваются так называемые гибридные
байесовские сети, с вершинами которых связаны как дискретные, так и непрерывные



                                                                                    7
переменные. Байесовские      сети часто применяются для моделирования технических
систем.
      3. Приобретение знаний, машинное обучение и автоматическое порождение
гипотез.
          Работы в области приобретения знаний интеллектуальными системами были и
остаются важнейшим направлением теории и практики искусственного интеллекта.
Целью этих работ является создание методологий, технологий и программных средств
переноса знаний и компетентности в базу знаний системы. При этом в качестве
источников знаний выступают эксперты (т.е. высококвалифицированные специалисты
предметных областей), тексты и данные, например, хранимые в базах данных.
      В соответствии с этим, развиваются различные методы приобретения знаний
      4. Интеллектуальный анализ данных и обработка образной информации.
      Это сравнительно новое направление, основу которого составляют две процедуры:
обнаружение закономерностей в исходной информации и использование обнаруженных
закономерностей для предсказания (прогнозирования). Сюда относят задачи выбора
информативных данных из большой их совокупности, выбора                информативных
характеристик некоторого объекта из более широкого множества его характеристик,
задачи построения модели, позволяющие вычислять значения выбранных информативных
характеристик по значениям других характеристик, и т.п.
      Значительную часть этого направления составляют исследования по различным
аспектам распознавания изображений, в частности, с помощью нейросетей (включая
псевдооптические нейросети). Изучаются методы распознавания последовательностей
видеообразов на основе декларативного подхода и извлечения семантически значимой
информации. К этому же направлению принадлежат исследования по графической
технологии программирования в Интернете.
      5. Многоагентные системы, динамические интеллектуальные системы и
планирование.
      Это направление, изучающее интеллектуальные программные агенты и их
коллективы.
      Основные      задачи   в   этой   области    таковы:   реализация   переговоров
интеллектуальных агентов и разработка языков для этой цели, координация поведения
агентов, разработка архитектуры языка программирования агентов.
  Следует подчеркнуть, что со времени появления агентских технологий

  интерес к ним переместился из сферы академических исследований в сферу
  коммерческих и промышленных приложений, а идеи и методы агентских технологий

                                                                                    8
весьма быстро мигрировали из искусственного интеллекта в практику разработки
  программного обеспечения и другие вычислительные дисциплины.

      С агентскими технологиями тесно связаны задачи планирования поведения, или
ИИ   - планирования      –    способность   интеллектуальной   системы   синтезировать
последовательность действий для достижения желаемого целевого состояния. Работы по
созданию эффективных методов такого синтеза востребованы и активно ведутся уже
около 30 лет.   Планирование является основой интеллектуального управления, т. е.
автоматического управления автономным целенаправленным поведением программно-
технических систем..
      6. Обработка естественного языка, пользовательский интерфейс и модели
пользователя.

      Это направление связано с разработкой систем поддержки речевого общения, c
решением проблем       уточнения   запроса в информационных системах, с повышением
точности поска, с задачами сегментации текстов по тематическим топикам, с задачами
управления диалогом, с задачами анализа естественного языка, с использованием
различных эвристик. Сюда же включаются проблемы дискурса (иногда под дискурсом
понимают совокупность речевых актов вместе с их результатами).

       По прежнему актуальны задачи обучения контекстному анализу текста, задачи
приобретения знаний интеллектуальными системами и        извлечения информации      из
текстов.
      Важнейшей задачей в процессе извлечения информации, как, впрочем, и в
процессе приобретения знаний, является минимизация роли эксперта – участника
процесса.
      Важность этого направления нельзя недооценивать. Причина тому - возрастание
потоков текстовой информации, существующий социальный заказ на поиск релевантной
информации в Интернете, на анализ текстовой информации, на извлечение данных из
текстов.
      Предметом исследований в этом направлении        является также динамическое моделир
пользователя, в частности, в системах электронной коммерции, адаптивный интерфейс, мониторин
и анализ пользовательского поведения в Интернете.


      7. Нечеткие модели и мягкие вычисления.




                                                                                     9
Это направление представлено нечеткими схемами вывода, «вывода по аналогии»,
взглядом на теорию нечетких мер с вероятностных позиций, нечетким представлениям,
аналитическими моделями для описания геометрических объектов, алгоритмами
эволюционного моделирования с динамическими параметрами, такими как время жизни и
размер популяции, методами решения оптимизационных задач с использованием
технологий генетического поиска, гомеостатических и синергетических принципов и
элементов самоорганизации.


      8. Разработка инструментальных средств.
      Это обширная сфера деятельности, ставящая перед собой задачи:
      а)создания программных средств приобретения знаний для автоматизированного
переноса знаний и компетентности в базы знаний. При этом в качестве источников могут
выступать не только «прямые» их носители – эксперты различных областей, но и
текстовые материалы – от учебников до протоколов, а также, разумеется, базы данных
(имплицитные источники знаний). Вербализация, то есть перевод таких источников в
эксплицитную форму составляет содержание методов обнаружения знаний в данных, в
том числе различных методов обучения по примерам (включая предобработку больших
массивов данных для дальнейшего анализа);
      б) реализации программных средств поддержки баз знаний.
      в) реализации программных средств поддержки проектирования интеллектуальных
систем. Набор таких средств    обычно содержит редактор текстов, редактор понятий,
редактор концептуальных моделей, библиотеку моделей, систему приобретения знаний от
экспертов, средства обучения по примерам и ряд других модулей.

Лекция 2. Формальные языки и формальные системы
      Основным и, пожалуй, главным для человека средством описания большей части
того, что ему известно, является естественный язык. Естественный язык обладает таким
спектром свойств - лексической неоднозначностью,         неполнотой, избыточностью,
возможностью противоречивых описаний, которые, безусловно, относятся к числу его
достоинств, но создают трудно преодолимые проблемы при попытках использования
текстов, написанных на естественном языке в компьютерных системах.
      Элементарную единицу лексики языка составляет слово, имеющее в большинстве
случаев не одно, а несколько значений. Любой текст на естественном языке может
содержать пробелы - явно не описанные, но подразумеваемые ситуации или их
фрагменты. В тексте или речи возможны повторы, которые подчеркивают наиболее


                                                                                  10
существенные соображения автора, расставляют акценты. Естественный язык допускает
противоречия. Более того, противоречия в языке - важный поэтический прием ("Речка
движется и не движется...").

      2.1. Язык исчисления предикатов первого порядка.
      Основные конструкции языка L – языка исчисления предикатов первого
порядка [1,2] называются формулами. Введем вначале алфавит языка L. Алфавит
включает:
1.   Счетное множество букв: z , y , x ,…; которое будем называть множеством символов
для обозначения переменных языка;
2.   Счетное множество букв a, b, c,  ; которое будем называть множеством символов

для обозначения констант языка;
1.   Счетное множество прописных букв P, Q,  ; для обозначения                      предикатных

символов языка;
3.   Счетное множество строчных букв f , g ,  ; для обозначения функциональных
символов;

4.   Символы для логических связок         → (влечет),    ¬   (не);

5.   Символ для квантора ∀ (для любого);

7. ( , ) - скобки.
Предикатные буквы P, Q, … и функциональные буквы f, g,…могут быть n – местными
или, как еще говорят, n – арными. Иначе говоря, с каждым предикатным или
функциональным символом будем связывать некоторое натуральное число, равное числу
его аргументов.
      Определим понятие формулы или правильно построенного выражения языка
исчисления предикатов первого порядка.
Формулы языка определяются индуктивным образом. Начнем с определения терма языка:
1.   Переменная есть терм.
2.   Константа есть терм.
3.    Если t1 ,t2 , …,tm ,…, tn - термы, а f и g – функциональные символы арности m и n,
         соответственно, то f (t1 ,t2 , …,tm ) и g(t1 ,t2 ,…,tn )     также термы.
4.   Если t1 ,t2 , …,tm ,…, tn - термы, а P и Q – предикатные символы арности m и n,
         соотвественно, то P(t1 ,t2 , …,tm ) и Q(t1 ,t2 ,…,tn )     - атомарные формулы.
5.   Атомарная формула есть формула.
6.   Если A, B - формулы, то (A → B), ¬A , ¬B - формулы.

7.   Если A – формула, то ∀xA– формула.

                                                                                              11
8.   Всякое слово в алфавите языка является формулой тогда и только тогда, когда это
можно показать с помощью конечного числа применений п.п. 1-7.
     Например, если бы мы пожелали таким образом описать язык теории групп, то
следовало бы задать один двуместный функциональный символ × (умножение) и одну
константу l (единицу). Предикатные символы в этом случае не понадобятся. Термами
тогда были бы выражения вида × (х, у) и ×(1× (×1)).
      Таким образом, мы завершили одно из возможных определений языка исчисления
предикатов первого порядка. Существуют и другие определения, однако, язык,
определенный нами, является полным, т.е. в нем выразимо все то, что выразимо в языках
(исчисления предикатов первого порядка), определенных любым иным способом.

      Можно, например, определить логические связки   ∧,∨   (читается и и или), выразив

их через связки → и ¬:

1.A∧B = ¬(A→¬B)


2. A∨ B =¬A→B


     Квантор существования       - ∃ (существует) также выражается через квантор
всеобщности и отрицание:
     ∃xA(x) = ¬∀x¬ A(x)



      Разумеется,
                    ∧,∨    и ∃ с тем же успехом можно было бы включить в язык в
качестве трех дополнительных символов. Есть, однако, некоторые преимущества в том,
чтобы сохранить список символов как можно более коротким. Например, индуктивные
определения и доказательства по индукции оказываются в этом случае короче.
     В дальнейшем нам придется использовать понятия свободного и связанного
вхождения переменной в формулу. Вхождение переменной x в формулу         A называется
связанным, если эта переменная следует за квантором существования или всеобщности,
предшествующими формуле A. В противном случае, вхождение переменной называется
свободным. Если в формуле A отсутствуют свободно входящие в нее переменные (т.е.
либо все переменные связаны, либо просто отсутствуют), то формула называется
замкнутой формулой или предложением. Атомарную           замкнутую формулу будем
называть фактом. В том случае, если язык состоит только лишь из предложений, то он


                                                                                     12
называется пропозициональным языком, а буквы A, B, …, входящие в формулы этого
языка – пропозициональными переменными.
     1.2.5. Пример.
     Рассмотрим иллюстративный пример, который назовем Мир кубиков.
     Пусть перед нами стоит задача написать программу, которая бы обеспечила
разумное поведение робота - строителя башни из кубиков.
      Введем вначале следующие предикатные символы:
On - двуместный предикатный символ “находиться на”;
Em - одноместный предикатный символ “ не находиться под кубиком”;
Er - находиться на земле.
      Тогда атомарная формула языка исчисления предикатов 1-го порядка On( x, y )
означает, что "Кубик    x находится на кубике y "; атомарная формула   Em(x ) означает,

что "Кубик   x    не находится под другим кубиком"; а атомарная формула Er (x)
означает, что " Кубик   x стоит на земле ".
      Мы полагаем, что эти формулы будут использованы в качестве элементов условий,
множеств добавляемых и удаляемых фактов в правилах. Но прежде чем говорить о
правилах, опишем устройство рабочей памяти. Если действовать таким же образом, как
было описано выше, следует задать интерпретирующее отображение I, которое каждому
предикатному символу поставит в соответствие некоторое отношение на множестве
кубиков. Основное множество M будет состоять из элементов, соответствующих кубикам.
      Итак, отображение I ставит в соответствие предикатному символу On бинарное
отношение на M, предикатным символам Em и Er – одноместные отношения на M.
Обозначим эти отношения так же, как соответствующие предикатные символы, только
иным шрифтом. Иначе говоря, I (On) = On,
      I (Em) = Em, I(Er) = Er.


      Поскольку все отношения конечны, то их можно представить в виде таблиц (Рис.
1.2.) Элементы множества М обозначим через m1 , m2 , …, mn.
                                   On




                                                                                     13
Em
         m1
         m2
       ………..
         mn

              Er
        m1
        m2
      ………..
        mn

                         Рис.1.2.1.
      В начальном состоянии первая из таблиц не заполнена, а две другие заполнены
полностью. Таким образом, на рис 1.2.1. изображено начальное состояние «Мира
кубиков». Целевое состояние должно иметь такой вид (заметим здесь, что мы считаем все
кубики идентичными и, поэтому, нумерации элементов из М не будем придавыать
значения) :


                              On
                   m2                 m1
                   m3                 m2
                   ….                 …
                   mn                 mn-1

         Em


              mn

          Er
              m1




                        Рис. 1.2.2.
      Если мы принимаем решение использовать описания состояний, приведенные на
рис. 1.2.1.и 1.2.2. в качестве рабочей памяти системы, основанной на правилах, то сами


                                                                                    14
правила должны применяться к описаниям этих состояний                  для порождения новых
состояний и такая система называется прямой системой правил. Однако, в рабочей памяти
можно хранить описания целей, подцелей и т.д. Такая система правил будет называться
обратной. Впрочем, различие между этими двумя системами правил можно провести
лишь на интуитивном уровне.
       Вернемся в мир кубиков и опишем прямую систему правил для робота – строителя
башен; вначале неформально.
       Правило первое. Если кубик находится на земле и если он не находится под другим
кубиком, то выполнить следующие действия: поднять              его и поставить на любой
кубик, не находящийся под другим кубиком; поместить в рабочую память факты из
множества добавляемых фактов и удалить факты            из множества удаляемых фактов
примененного правила.
.      Правило второе. Если кубик находится на земле и если он не находится под
другим кубиком и если некоторый кубик не находится под кубиком и находится на
некотором другом кубике, то выполнить следующие действия: поднять кубик,
находящийся на земле и поместить его на кубик, находящийся на другом кубике;
поместить в рабочую память факты из множества добавляемых фактов и удалить факты
из множества удаляемых фактов примененного правила.
              Для решения этой задачи можно было бы построить систему и из одного
правила. Однако это привело бы к серьёзному усложнению этого правила и увеличению
вычислительных трудностей на этапе исполнения. Кроме того, трудно было бы
продемонстрировать возможности стратегии управления.
       Перейдем к уточнению вида правил для решения этой задачи. Обозначим правила
через П1 и П2, т.е.


                                 П1 = <С1 , A1, D1 > , где
.                               С1= { Em( y ) , Er ( y ) , Er (x) },

                                  A1= {On (x, y)},
                                  D1= { Em( y ) , Er (x) }.




                                 П2 = <С2 , A2, D2 >, где
                                 С2= { Em(x) , Er (x) , Em( y ) , On (y, z) },


                                                                                         15
A2= {On (x, y)},
                                  D2= { Er (x) , Em( y ) }.



      Стратегия управления, которая потребуется для решения этой задачи, описана в п
1.2.3 . Напомним её:
     Шаг 1. Выбрать очередное правило из множества правил;
     Шаг 2. Проверить выполнимость условия правила в текущем состоянии рабочей
     памяти;
     Шаг 3. Если условие правила выполнено, поместить правило в конфликтное
     множество;
     Шаг 4. Если множество применимых правил исчерпано, выбрать какое-             либо
     правило из конфликтного множества правил и применить его.
     Шаг 5. Перейти к шагу 1.


     В нашем примере к начальному состоянию применимо лишь первое правило (т.к. в
начальном состоянии таблица On пуста и, следовательно, формула On(x,y) невыполнима),
поэтому в начальном состоянии конфликтное множество состоит из одного лишь правила

и проблемы выбора не возникает. При установлении выполнимости формул Em( y ) ,

Er ( y ) Er (x )
       ,           в условия первого правила вместо свободных переменных в формулы

условия будут подставлены значения (например, m1 вместо y и m2 вместо x).

Соответствующие подстановки будут выполнены также в формулы из множеств А и D.

Атомарные формулы из множеств          А и D превратятся в формулы без свободных

переменных, т.е. в добавляемые и удаляемые факты, а именно, формулы On (x, y) из

множества добавляемых фактов и Em(y) и Er(x) из множества удаляемых фактов примут

вид On (m2, m1) , Em(m1), Er(m2), соответственно. Применение правила состоит в том, что

первая пара, т.е. (m2, m1 ) будет помещена в таблицу On, а значения переменных из второй
и третьей формул, т.е. m1 и m2, соответственно,– удалены из таблиц Em и Er. Таким
образом, мир кубиков будет модифицирован и в рабочей памяти появится описание
второго состояния.



                                                                                      16
К этому, второму состоянию оказываются применимы оба правила. Т.к. множество
   применимых правил будет теперь состоять из двух правил, то необходимо уточнить
   шаг 4 стратегии управления, т.е. значение слов «какое – либо правило».
      Если попытаться промоделировать стратегию управления «вручную», то нетрудно
   убедиться, что на втором шаге следует применить второе правило. Чтобы обеспечить
   строительство одной башни (а не нескольких), второе же правило следует применять и
   на всех последующих шагах. Второе правил отличается от первого большим
   количеством атомарных формул в условии. Таким образом, возникает следующий
   эмпирический принцип выбора:         всякий раз, когда к некоторому состоянию
   применимо более одного правила, должно выбираться правило, более точно
   учитывающее особенности текущего состояния; таким правилом, очевидно, является
   то правило, условие которого более детально описывает состояние.
      Поскольку степень детальности описания состояния определяется количеством
   атомарных формул в условии правила, то стратегия разрешения конфликтного
   множества, которую следует здесь применить,       имеет в своей основе следующую
   эвристику:
      “Выбрать из множества применимых правил то правило, условие которого
содержит наибольшее число различных атомарных формул».
      Именно так следует в данном случае модифицировать шаг 4 стратегии управления.
      Применение сформулированной эвристики приведет к выбору второго правила и
на всех последующих шагах.
      Процесс завершится либо по исчерпании применимых правил, либо по достижении
целевого состояния.
      К системам правил мы бдем возвращаться и в дальнейшем; им будет уделено
достаточно много места в четвертой главе; пока же рассмотрим иной способ
представления знаний, называемый семантическими сетями.



Лекция 3. Представление знаний. Системы, основанные на правилах                  или
продукционные системы.
      Если рассматривать многие интеллектуальные системы, то на самом высоком
уровне их описания можно выделить следующие компоненты: рабочую память (или, как
иногда говорят, глобальную базу данных), множество правил, выполняющих некоторые
действия (во внешней среде и в рабочей памяти) и некоторую стратегию управления, в
соответствии с которой     происходит выбор правил для применения и выполнение
действий.

                                                                                   17
Правила применяются к рабочей памяти. В состав каждого правила входит
некоторое условие, которому текущее состояние рабочей памяти может удовлетворять,
либо нет. Правило может быть применено, если условие выполнено. Применение правила
изменяет состояние рабочей памяти. Стратегия управления выбирает, какое именно
правило из числа применимых следует использовать и прекращает вычисления, когда
состояние рабочей памяти удовлетворяет целевому условию.
       С точки зрения архитектуры такой подход обладает следующими существенными
отличиями от архитектур традиционных программных систем:
-   рабочая память доступна всем правилам;
-   отсутствуют вызовы правил из других правил;
-   отсутствует априорно заданный алгоритм решения задачи (т.е. порядок выполнения
    правил) – алгоритм решения задачи является одним из результатов её решения;
-   данные и результаты вычислений становятся доступными правилам только через
    рабочую память.
       Особенности организации систем, основанных на правилах, как легко видеть,
    обеспечивают, в значительной степени, модульный их характер и изменения в рабочей
    памяти, множестве правил или в стратегии управления могут проводиться
    относительно независимо. Эти свойства систем, основанных на правилах, хорошо
    согласуются с эволюционным характером разработки больших программных систем,
    предполагающих использование значительных объемов знаний.
       Перейдем теперь к более детальному изложению основных идей систем,
    основанных на правилах, следуя, главным образом, работам [4,5].
3.1.Правила для представления знаний.
Определение 3.1. Правилом       называется упорядоченная тройка множеств П =
 C , A, D , где




                                                                                   18
С – условие правила;
     А – множество добавляемых правилом фактов;
     D -множество удаляемых правилом фактов.
     Как и было обещано в начале главы, для записи элементов основных конструкций
языка представления знаний (в данном случае, языка правил), т.е. условия C правила П,
множеств A и D         будем (хотя это не обязательно)     использовать язык исчисления
предикатов первого порядка. А именно, будем полагать, что каждое из упомянутых
множеств есть множество атомарных формул языка исчисления предикатов первого
порядка.


     Напомним здесь, что в предыдущей лекции фактами были названы атомарные
формулы исчисления предикатов первого порядка без свободных переменных.
     В связи с этим, будем считать, что в правилах атомарные формулы из множеств С, А
и D превращаются в факты в процессе применения правила, т.е. в результате выполнения
соответствующих подстановок (m1 , m2 ,…, mn ) на места свободных переменных (x1 ,x2 ,
…,xn ) и проверки для каждой формулы P(x1 ,x2 ,…,xn ) из С условия (m1 , m2 ,…, mn ) ∈
I(P), т.е. выполнимости в текущем состоянии рабочей памяти.
     Определение 3.2. Будем говорить, что условие правила выполнено, если в текущем
состоянии рабочей памяти истинна каждая из атомарных формул условия.
     Определение 3.3.      Правило применимо к      состоянию рабочей памяти, если его
условие выполнено в этом состоянии.
     3.2.Рабочая память.
     Рабочая память должна быть согласована с множеством правил. Согласование
выполняется следующим образом: пусть П – некоторое множество правил; С, A и D –
объединения условий, множеств добавляемых фактов и множеств удаляемых фактов по
всему множеству П. М- множество индивидов предметной области. Тогда для каждой n –
местной атомарной формулы P (x, y, …, z) ∈ С ∪ A ∪ D             рабочая память должна
содержать n – местное конечное отношение I (P) ⊆ Mn , где I – интерпретирующее
отображение (Рис.1.2.)

            P ( x ),                       P2 ( y , z ),                      P ( x, y , v )
                                                                               3
             1




            R1                                      R2                            R3




                                                                                       19
Рис. 1.2. (Стрелками показано отображение I )




     Таким образом, рабочая память должна содержать множество конечных отношений
или таблиц, каждая из которых является интерпретацией одного из предикатных
символов, входящего в объединенное множество условий, списка добавляемых или
удаляемых фактов.
     Заметим здесь, что правило можно рассматривать как действие или команду
исполнительному органу, которая может разворачиваться в последовательность действий.
Добавляемые и удаляемые правилом факты называются эффектом действия и
выполняют модификацию модели мира, т.е. формируют           в рабочей памяти системы
отражение тех изменений в мире, которые произошли после выполнения действий,
предписанных правилом.
     Правила могут, также, рассматриваться как средство пополнения знаний о мире,
например, в результате обучения.


     3.3. Стратегии управления
     Стратегии управления предназначены для организации процесса вычислений.
     В самом общем виде стратегию управлеия можно описать следующим образом:
     Шаг 1. Выбрать очередное правило из множества правил;
     Шаг 2. Проверить выполнимость условия правила в текущем состоянии рабочей
     памяти;
     Шаг 3. Если условие правила выполнено, поместить правило в конфликтное
     множество;
     Шаг 4. Если множество применимых правил исчерпано, выбрать какое-либо правило
     из конфликтного множества правил и применить его.
     Шаг 5. Перейти к шагу 1.
     Условиями остановки являются пустое конфликтное множество, либо достижение
   целевого состояния.



                                                                                  20
Приведенная стратегия порождает недетерминированный процесс, поскольку она не
устанавливает, каким образом следует выбирать правило из множества применимых
правил.
   В      большинстве   случаев   информации,   доступной   стратегии     управления,
недостаточно для точного решения задачи выбора. Поэтому работу систем,
основанных на правилах, можно охарактеризовать как процесс поиска, при котором
правила подвергаются испытанию до тех пор, пока не обнаружится, что некоторая их
последовательность порождает состояние рабочей памяти, удовлетворяющее целевому
условию. При этом часто используются различные эвристики, сокращающие перебор.
(Эвристикой будем называть правило выбора без достаточных теоретических
оснований). Вид эвристики обычно диктуется условиями задачи. Позже мы обсудим
различные эвристики, а пока уточним, что стоит за словами                 «Проверить
выполнимость условия правила» и «Применить правило».
   В п.3.2. было установлено соответствие между множеством атомарных формул
условий, множеств добавляемых и удаляемых фактов из правил и множеством
отношений рабочей памяти.
   Проверка выполнимости условия выбранного правила состоит в том, в каждую
атомарную формулу P (x, y, …, z) условия подставляются значения из текущего
состояния рабочей памяти, а именно из таблицы, соответствующей         P (x, y, …, z) в
смысле отображения I. При этом обычно известно и соответствие столбцов таблицы I
(Р) сортам аргументов формулы P (x, y, …, z) (в многосортном языке).
   Если существует подстановка σ = (m1 , m2 , …, mn ), такая что σ ∈ I (Р), то
формула P (x, y, …, z) условия выполняется на ней или, иначе говоря, выполняется в
текущем состоянии рабочей памяти.
   Если существуют подстановки σ1, σ2, …, σk , такие что на местах одноименных
свободных переменных всех формул условия оказываются одни и то же значения
(подставленные из соответствующих таблиц) и при этом все формулы условия
оказываются выполнены, то условие правила выполнено в текущем состоянии рабочей
памяти.
            Что касается применения правила, оно состоит в том, что в текущее
состояние рабочей памяти добавляются факты из множества добавляемых фактов
правила и удаляются факты из множества удаляемых фактов.




                                                                                     21
Происходит это следующим образом. Если установлена выполнимость условия
   некоторого правила, свободные переменные в формулах условия, как было сказано
   выше, приобретают значения из записей текущего состояния рабочей памяти. При
   этом происходят и замены свободных переменных в формулах из множеств        AиD
   теми значениями, которые были подставлены на места одноименных свободных
   переменных в формулы условия. Для тех формул из множества A, которые в
   результате этого процесса превратились в факты, значения, находящиеся на местах
   свободных переменных, дописываются в таблицы, соответствующие этим формулам в
   смысле отображения I, для формул же из множества D, которые также в результате
   этого процесса превратились в факты, значения, находящиеся на местах свободных
   переменных,      удаляются из таблиц, соответствующих этим фактам в смысле
   отображения I.
     В дальнейшем тройку: множество правил + рабочая память + стратегия
управления будем называть системой, основанной на правилах.
     Состоянием системы, основанной на правилах, будем называть состояние рабочей
памяти вместе с множеством применимых правил.
     Системы, основанные на правилах, являются важным классом систем, основанных
на знаниях.

Лекция 4. Представление знаний. Cемантические сети и системы фреймов.
    Семантические сети наряду с системами правил являются весьма распространенным
способом представления знаний в интеллектуальных системах. Особое значение этот
способ представления знаний приобретает в связи с развитием сети интернет. Кроме ряда
особенностей, позволяющих применять семантические сети в тех случаях, когда системы
правил не применимы, семантические сети обладают следующим важным свойством: они
дают возможность соединения в одном представлении синтаксиса и семантики или
синтаксического и семантического аспекта описаний знаний предметной области.
Происходит это благодаря тому, что в семантических сетях наряду с переменными для
обозначения тех или иных объектов (элементов множеств, некоторых конструкций из них)
присутствуют и сами эти элементы и конструкции; присутствуют и                 связи,
сопоставляющие тем или иным переменным множества допустимых интерпретаций. Эти
обстоятельства      позволяют   во   многих   случаях   резко   уменьшить   реальную
вычислительную сложность решаемых задач.




                                                                                   22
4.1. Простые и расширенные семантические сети.
     Понятие семантической сети возникло в 1966 г. году в работах М.Р.Квиллиана [7]
при попытке описания семантики глагола с помощью графа специального вида. Это
описание   было составлено из вершин, в которых находились лексические единицы
анализируемого предложения и «ассоциативных» дуг, служащих для описания ссылок
одних вершин на другие. Для таких описаний М.Р. Квиллиан ввел термин «семантическая
память».    Каждой вершине        в семантической памяти соответствовала некоторая
«страница», содержащая определение соответствующего вершине понятия. Каждый из
указателей относился к одному из следующих типов: подкласс, дизъюнкция, конъюнкция,
свойство, субъект.
     Такие структуры обладали некоторыми дедуктивными свойствами, порождаемыми
отношениями «подкласс» и «свойство». Один из механизмов вывода в семантической
сети Квиллиана состоял в распространении активности и поиске по пересечению. Пути
от начальных вершин к общей вершине определяют некоторое отношение между двумя
лексическими единицами. Иначе говоря, речь шла об обнаружении неявно (имплицитно)
заданной информации для дальнейшего ее использования в интеллектуальной системе.
     Роберт Ковальский из Эдинбурга в 1979 г. [8] ввел понятия простых и расширенных
семантических сетей, использовав клаузальную логику для их определения.
     Для рассмотрения семантических сетей такого вида вернемся к языку исчисления
предикатов первого порядка, а именно, к его клаузальной форме.
     Клауза есть выражение вида B1 , B2 ,..., Bm ← A1,...,An
где B1 , B2 ,..., Bm суть атомарные формулы, n≥0 и m≥0.
Атомарные формулы A1,...,An суть совместные посылки клаузы, а B1 , B2 ,..., Bm суть
альтернативные заключения. (Множество клауз совместно, если оно истинно в одной из
моделей языка).
      Если клауза содержит переменные x1, x2,…,xk, то она соответствует формуле с
квантором всеобщности: ∀x1, ∀x2 ,…, ∀xk (B1 ∨ B2 ∨... ∨ Bm, если A1^,…,^ An.)

Если n=0, то клаузу следует интерпретировать так:
     ∀ x1, ∀x2,…, ∀xk, (B1 ∨ B2 ∨... ∨ Bm.). Если m=0, то интерпретация такова: ¬∃ x1,
¬∃x2,…, ¬∃xk A1^,…,^ An.
Если n=m=0 то клауза является тождественно ложным высказыванием и записывается .
      Если клауза содержит не более одной атомарной формулы в заключении, т.е.m≤1,
то клауза называется клаузой Хорна или Хорновской клаузой.

                                                                                    23
Простая семантическая сеть может рассматриваться как форма записи
утверждений клаузальной логики без свободных переменных. Например, клауза P(a,b) ←
в языке простых семантических сетей изображается как дуга, помеченная меткой P и
направленная из a в b:


             a          P                b
                        рис.1.3.1.
         В расширенных семантических сетях, как и в простых, вершины сопоставляются
индивидам, а ребра – бинарным отношениям.
         Однако, вершины в расширенных семантических сетях могут соответствовать
константным символам, переменным или термам, содержащим функциональные символы.
Атомарные формулы, соответствующие условиям клауз описываются с помощью
двойных дуг, а заключения - одинарных. Клаузы, содержащие более одной атомарной
формулы, можно выделять как подсети. Например, расширенная семантическая сеть на
рис.1.3.2.
                                     нравится
                 Мэри                                      X
         нравится               нравится


                                                Боб
                                                                             Джон
логика
             Является                                                     нравится
нравится


                               Человек                          у




                               Рис.1.3.2.


соответствует множеству клауз:
Джону нравится Мери ←
Джон является человеком←
Мери нравится Джон, Мери нравится Боб←Мери нравится x


                                                                                 24
Бобу нравится y←y нравится логика
Наклонная прямая отделяет подсеть, содержащую условия (левая верхняя полуплоскость)
от подсети заключений.
      Помимо изобразительных возможностей, семантические сети обладают более
серьезными достоинствами. То обстоятельство, что вся информация об индивиде
представлена в единственном месте – в одной вершине, означает, что вся эта информация
непосредственно доступна в этой вершине, что, в свою очередь сокращает время поиска, в
частности, при выполнении унификации и подстановки в задачах логического вывода.
      Существует еще одна, более тонкая особенность расширенных семантических
сетей – они позволяют интегрировать в одном представлении синтаксис и семантику
(т.е. интерпретацию) клаузальных форм. Это позволяет в процессе вывода обеспечивать
взаимодействие синтаксических и семантических, теоретико-модельных подходов, что, в
свою очередь, также является фактором, зачастую делающим вывод более эффективным.


      4.2. Универсум Эрбрана и семантические сети.


      Здесь мы развернем тезис, сформулированный в последнем абзаце предыдущего
раздела. Пусть задано некоторое множество клауз. Попытаемся «экономным» способом
построить для него модель. Это означает, что следует выбрать некоторый универсум и
указать соответствие между константами и иными конструкциями языка и объектами
этого универсума и конструкциями из них. Следуя принципу экономии, мы не будем
вводить специальных имен для элементов модели, поэтому выберем в качестве
универсума такое множество, которое включает все константы, встречающиеся в
множестве клауз и все термы, построенные из них с помощью функциональных
символов, встречающихся в множестве клауз. Такое множество называется универсумом
Эрбрана.
      Иначе говоря, интерпретация I есть в данном случае тождественное отображение
из множества термов в себя. Далее, доведя принцип экономии до предела, мы используем
n – местные предикатные символы, встречающиеся в клаузах, для обозначения
соответствующих им при отображении I        n –   арных отношений над элементами
универсума.
      Рассмотрим простой пример.




                                                                                    25
Пусть задано множество клауз.
      Всякий человек, который является хозяином собак, не является хозяином кошек.
      Джон является хозяином Линды
      Петя является хозяином Мурки
      Введем бинарные предикатные символы P – быть хозяином и Q – не быть хозяином.
Тогда клаузальная форма этих утверждений имеет следующий вид:
      Q(человек, кошка) ←P(человек, собака)
      P(Джон, Линда) ←
      P(Петя,Мурка) ←.
      Для полноты картины введем еще один предикатный символ, означающий
принадлежность экземпляра (примера) общему понятию. В теории интеллектуальных
систем его принято обозначать ISA (“is a” - третье лицо единственного числа английского
глагола to be):
      ISA (Джон, человек) ←
      ISA (Петя, человек) ←
      ISA (Линда, собака) ←
      ISA (Мурка, кошка)
      (Иногда этот предикатный символ используется в инфиксной нотации, например,
«Джон ISA человек», но это не имеет существенного значения).
      Представим теперь описанную ситуацию в виде расширенной семантической сети
(рис.1.3.3).
                         Петя                               Линда


                                              Джон


       Мурка                                                   Собака


                                    Человек


               Кошка


                           Рис.1.3.3.




                                                                                     26
На рис. 1.3.3. каждому предикатному символу соответствует свой тип линии, а
именно:
     P-
     ISA -
     Q-
     Направление стрелки указывает порядок следования аргументов в формуле.
     Если сопоставить этот рисунок со сказанным об универсуме Эрбрана, то легко
видеть, что закрашенные вершины соответствуют элементам,     а пары (Петя, Мурка),
(Джон, Линда) – элементам отношений универсума Эрбрана, а именно – отношению P.
Что касается пар (Мурка, кошка), (Линда, собака) (Петя, человек) и (Джон, человек),
принадлежащих отношению ISA, то они связывают синтаксис с семантикой или
синтаксические элементы “Кошка”, “Собака” и “Человек”, являющиеся именами общих
понятий, с примерами этих понятий.
     Оставив более детальное изучение полезных свойств универсума Эрбрана      для
последующих глав, используем нотацию расширенных семантических сетей для ответа на
вопрос “Является ли Джон хозяином Мурки?” Для решения этой задачи вначале
совместим пары закрашенных вершин с парами незакрашеных по ISA ребрам, при этом
метка ребра пары закрашенных вершин должна совпадать с меткой ребра пары
незакрашенных вершин. Затем проделаем такую же операцию с интересующими нас
целевыми вершинами (т.е. совместим их с не закрашенными вершинами по ISA – связям)
в результате чего немедленно получим, что Джон не является хозяином Мурки. Этот
простой пример есть пример вывода на расширенной семантической сети.




                                                                                 27
В 1986 году В.Н. Вагиным [9] были предложены раскрашенные семантические
сети. В отличие от расширенных семантических сетей, в раскрашеных семантических
сетях вершины соответствуют           клаузам, их условиям, заключениям и          предикатным
символам, в них входящим, а ребра, связывают условия и заключения клауз с вершинами,
соответствующими клаузам. Далее, атомарные формулы, входящие в условия и
заключения соединяются ребрами с вершинами, соответствующими условиям и
заключениям и, наконец, индивидные символы соединяются ребрами с вершинами,
соответствующими атомарным формулам. Кроме того, введены специальные правила
раскраски семантических сетей. Они таковы: для каждой клаузы A ← B условие и
заключение “раскрашиваются” различными цветами. Это правило распространяется также
на тот случай, когда как условие, так и заключение состоят более чем из одной атомарной
формулы.   Раскрашенные        сети    позволяют    более   эффективно,      чем   предыдущие
представления,     организовать процесс параллельной дедукции. Более подробную
информацию о них можно почерпнуть из литературы, указанной в конце книги.
     В 1987 году автор этих строк [10] ввел понятие неоднородных семантических сетей.
     Приведем краткое описание этого способа представления знаний.


     4.3. Неоднородные семантические сети.
     Неоднородная семантическая сеть (НСС) – семейство графов, имеющих общее
множество вершин; вершинам сопоставлены объекты моделируемой действительности,
ребрам - элементы некоторых бинарных отношений на множестве вершин; ребрам же
сопоставлены     процедуры,    предназначенные      для проверки корректности          сети   и
порождения различного рода гипотез, повышающих эффективность процесса построения
сети. Подробнее о роли таких процедур будет сказано в главе, посвященной
приобретению знаний.
     НСС предназначены         для описания, главным образом, таких областей, которые
можно отнести к плохо структурированным, т.е. областей, для которых не известен
полный набор свойств их индивидов, не полностью известна структура самих индивидов,
а знания об индивидах и их взаимосвязях             и зависимостях     не имеют «готового»,
завершенного вида, такого, например, который описывается с помощью правил. При этом
предполагается, что те связи и зависимости, которые удается, всё же, установить, носят
локальный характер.
      .

      Определение     1.3.1.   Неоднородной        семантической     сетью   будем    называть
алгебраическую систему
                                                                                              28
H=<D, N, R, F> , где

      D={ D1, D2,..., Dn} - семейство непустых множеств;
      N ⊆ N – выделенное подмножество множества слов конечной длины над
некоторым алфавитом;
      R - семейство бинарных отношений R1, R2,...,Rq на N2; Ri⊆ N2 ; i∈{1, 2, …, q}.
      F ={f1,f2,...,fm}   семейство функций, каждой из которых приписан некоторый тип.
А именно, функция fi (i∈{1,2, …, m}) имеет тип <τ, ω> , где τ = <k1, k2, …, km> если она
определена на декартовом произведении D k1 x D k2 x ... x D   km   , а областью её значений
является множество Dω , так что каждому кортежу δ ∈ D k1 x D k2 x ... x D km функция f i
типa <τ, ω>      из F ставит     в   соответствие некоторый элемент        f(δ) из Dω. То
обстоятельство, что fi имеет тип <τ, ω> будем обозначать <τ, ω> (fi).
      Неоднородную семантическую сеть, определенную таким образом, будем называть
интенсиональной семантической сетью.

Лекция 5. Рассуждения. Автоматизация дедуктивных рассуждений.


      Вначале приведём краткую характеристику основных процедур рассуждений,
таких как дедукция, индукция, аналогия, рассуждения на основе прецедентов, абдукция и
аргументация. Затем более детально рассмотрим методы автоматизации некоторых из
названных типов рассуждений в вычислительных системах. Начнем с дедуктивных
рассуждений.

    Дедуктивное рассуждение - это последовательность дедуктивных умозаключений.
Дедуктивным называют такое умозаключение, в котором из знания большей степени
общности выводится знание меньшей степени общности. Первые точные схемы
дедуктивных умозаключений принадлежат Аристотелю (384-322 г.г. до нашей эры). Эти
схемы носят название силлогизмов. К числу основных силлогизмов Аристотеля относятся
категорический силлогизм, условный силлогизм, разделительный силлогизм, условно-
разделительный силлогизм; сокращенные, сложные и сложносокращенные силлогизмы
или энтимемы.
      Каждый из силлогизмов имеет несколько разновидностей, отличающихся друг от
друга количеством и качеством посылок и называемых модусами.                 Связано такое
разделение с тем, что все суждения по своему качеству делятся на четыре вида:



                                                                                         29
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта

More Related Content

What's hot

Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
Lidia Pivovarova
 
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
AIST
 
ен.02 элементы математической логики
ен.02 элементы математической логикиен.02 элементы математической логики
ен.02 элементы математической логики
Stepan1234
 
ису методы ису
ису методы исуису методы ису
ису методы ису
fluffy_fury
 
методы ису
методы исуметоды ису
методы ису
fluffy_fury
 
презентация 1 сколково.(28 л)
презентация 1   сколково.(28 л)презентация 1   сколково.(28 л)
презентация 1 сколково.(28 л)
vagrachev
 
лекция презентация 1. информация
лекция презентация 1. информациялекция презентация 1. информация
лекция презентация 1. информация
Ufkbyf49
 
неограйсианство и экспериментальная прагматика
неограйсианство и экспериментальная прагматиканеограйсианство и экспериментальная прагматика
неограйсианство и экспериментальная прагматика
form_phil
 
приложение в. учёные в области нейроэлектроники и нкт
приложение в. учёные в области нейроэлектроники и нктприложение в. учёные в области нейроэлектроники и нкт
приложение в. учёные в области нейроэлектроники и нкт
Shchoukine Timour
 
Основы формальной и математической логи
Основы формальной и математической логиОсновы формальной и математической логи
Основы формальной и математической логи
Evgeny Smirnov
 

What's hot (19)

Андрей Курьян Изобретательское творчество в инженерии требований
Андрей Курьян Изобретательское творчество в инженерии требованийАндрей Курьян Изобретательское творчество в инженерии требований
Андрей Курьян Изобретательское творчество в инженерии требований
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
 
потапов
потаповпотапов
потапов
 
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
 
Экспертные системы: лекция №1
Экспертные системы: лекция №1Экспертные системы: лекция №1
Экспертные системы: лекция №1
 
ен.02 элементы математической логики
ен.02 элементы математической логикиен.02 элементы математической логики
ен.02 элементы математической логики
 
Системная инженерия, сферная инженерия
Системная инженерия, сферная инженерияСистемная инженерия, сферная инженерия
Системная инженерия, сферная инженерия
 
В.Алейник -- системные подходы П.Чекланда и Г.П.Щедровицкого
В.Алейник -- системные подходы П.Чекланда и Г.П.ЩедровицкогоВ.Алейник -- системные подходы П.Чекланда и Г.П.Щедровицкого
В.Алейник -- системные подходы П.Чекланда и Г.П.Щедровицкого
 
Сферная инженерия. С.Переслегин
Сферная инженерия. С.ПереслегинСферная инженерия. С.Переслегин
Сферная инженерия. С.Переслегин
 
04 1 информатика 10-11. книга 1-шауцукова_2004
04 1  информатика 10-11. книга 1-шауцукова_200404 1  информатика 10-11. книга 1-шауцукова_2004
04 1 информатика 10-11. книга 1-шауцукова_2004
 
ису методы ису
ису методы исуису методы ису
ису методы ису
 
методы ису
методы исуметоды ису
методы ису
 
презентация 1 сколково.(28 л)
презентация 1   сколково.(28 л)презентация 1   сколково.(28 л)
презентация 1 сколково.(28 л)
 
Сергей Переслегин. Инженерия XXI века
Сергей Переслегин. Инженерия XXI векаСергей Переслегин. Инженерия XXI века
Сергей Переслегин. Инженерия XXI века
 
лекция презентация 1. информация
лекция презентация 1. информациялекция презентация 1. информация
лекция презентация 1. информация
 
неограйсианство и экспериментальная прагматика
неограйсианство и экспериментальная прагматиканеограйсианство и экспериментальная прагматика
неограйсианство и экспериментальная прагматика
 
приложение в. учёные в области нейроэлектроники и нкт
приложение в. учёные в области нейроэлектроники и нктприложение в. учёные в области нейроэлектроники и нкт
приложение в. учёные в области нейроэлектроники и нкт
 
В.Батоврин -- заметки о системной инженерии в СССР.
В.Батоврин -- заметки о системной инженерии в СССР.В.Батоврин -- заметки о системной инженерии в СССР.
В.Батоврин -- заметки о системной инженерии в СССР.
 
Основы формальной и математической логи
Основы формальной и математической логиОсновы формальной и математической логи
Основы формальной и математической логи
 

Viewers also liked (7)

HTML Form
HTML Form HTML Form
HTML Form
 
F 2 corso va 14 gennaio 2013
F 2 corso va 14 gennaio 2013F 2 corso va 14 gennaio 2013
F 2 corso va 14 gennaio 2013
 
สรุปผลการตรวจสอบความสมบูรณืของเวชระเบียนผู้ป่วยนอกปีงบประมาณ 2555
สรุปผลการตรวจสอบความสมบูรณืของเวชระเบียนผู้ป่วยนอกปีงบประมาณ 2555สรุปผลการตรวจสอบความสมบูรณืของเวชระเบียนผู้ป่วยนอกปีงบประมาณ 2555
สรุปผลการตรวจสอบความสมบูรณืของเวชระเบียนผู้ป่วยนอกปีงบประมาณ 2555
 
기자에게 필요한 sns 사용 방법 v.1302
기자에게 필요한 sns 사용 방법 v.1302기자에게 필요한 sns 사용 방법 v.1302
기자에게 필요한 sns 사용 방법 v.1302
 
Test
TestTest
Test
 
AIDS
AIDSAIDS
AIDS
 
Transformasi pendidikan vokasional
Transformasi pendidikan vokasionalTransformasi pendidikan vokasional
Transformasi pendidikan vokasional
 

Similar to Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта

главная документация.docx
главная документация.docxглавная документация.docx
главная документация.docx
ssuser090a572
 
Некоторые физические законы в контексте автоматизации тестирования
Некоторые физические законы в контексте автоматизации тестированияНекоторые физические законы в контексте автоматизации тестирования
Некоторые физические законы в контексте автоматизации тестирования
COMAQA.BY
 
Законы создания IT команд и следствия законов для IT проектов «на пальцах»
Законы создания IT команд и следствия законов для IT проектов «на пальцах»Законы создания IT команд и следствия законов для IT проектов «на пальцах»
Законы создания IT команд и следствия законов для IT проектов «на пальцах»
CEE-SEC(R)
 
лекция 1
лекция 1лекция 1
лекция 1
szvonarev
 
П.Н. Барышников Философия It и мифы современного университета
П.Н. Барышников Философия It и мифы современного университетаП.Н. Барышников Философия It и мифы современного университета
П.Н. Барышников Философия It и мифы современного университета
Павел Барышников
 

Similar to Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта (20)

Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышление
 
древо компьютерных наукAygun
древо компьютерных наукAygunдрево компьютерных наукAygun
древо компьютерных наукAygun
 
л 2 13
л 2 13л 2 13
л 2 13
 
Лекция "Задача моделирования когнитивной эволюции"
Лекция "Задача моделирования когнитивной эволюции"Лекция "Задача моделирования когнитивной эволюции"
Лекция "Задача моделирования когнитивной эволюции"
 
Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)Системное мышление -- материалы курса (2016)
Системное мышление -- материалы курса (2016)
 
Мастер-класс: Системное мышление
Мастер-класс: Системное мышлениеМастер-класс: Системное мышление
Мастер-класс: Системное мышление
 
главная документация.docx
главная документация.docxглавная документация.docx
главная документация.docx
 
Некоторые физические законы в контексте автоматизации тестирования
Некоторые физические законы в контексте автоматизации тестированияНекоторые физические законы в контексте автоматизации тестирования
Некоторые физические законы в контексте автоматизации тестирования
 
Законы создания IT команд и следствия законов для IT проектов «на пальцах»
Законы создания IT команд и следствия законов для IT проектов «на пальцах»Законы создания IT команд и следствия законов для IT проектов «на пальцах»
Законы создания IT команд и следствия законов для IT проектов «на пальцах»
 
Искусственный интеллект
Искусственный интеллектИскусственный интеллект
Искусственный интеллект
 
Моделирование сложных систем и обработка больших объемов данных: ищем общие п...
Моделирование сложных систем и обработка больших объемов данных: ищем общие п...Моделирование сложных систем и обработка больших объемов данных: ищем общие п...
Моделирование сложных систем и обработка больших объемов данных: ищем общие п...
 
Отчетный доклад от группы Вопрошание
Отчетный доклад от группы ВопрошаниеОтчетный доклад от группы Вопрошание
Отчетный доклад от группы Вопрошание
 
Введение в Искусственный Интеллект / Introduction into Artificial Intelligence
Введение в Искусственный Интеллект / Introduction into Artificial IntelligenceВведение в Искусственный Интеллект / Introduction into Artificial Intelligence
Введение в Искусственный Интеллект / Introduction into Artificial Intelligence
 
Ai v3
Ai v3Ai v3
Ai v3
 
19.урок информатики «информационные модели. система, структура системы»
19.урок информатики «информационные модели. система, структура системы»19.урок информатики «информационные модели. система, структура системы»
19.урок информатики «информационные модели. система, структура системы»
 
Ws 26 5plus
Ws 26 5plusWs 26 5plus
Ws 26 5plus
 
лекция 1
лекция 1лекция 1
лекция 1
 
П.Н. Барышников Философия It и мифы современного университета
П.Н. Барышников Философия It и мифы современного университетаП.Н. Барышников Философия It и мифы современного университета
П.Н. Барышников Философия It и мифы современного университета
 
Экспертные системы
Экспертные системыЭкспертные системы
Экспертные системы
 
презентация проекта Искусственный интеллект
презентация проекта Искусственный интеллектпрезентация проекта Искусственный интеллект
презентация проекта Искусственный интеллект
 

Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта

  • 1. Министерство образования и науки Российской Федерации Рыбинская Государственная Авиационная Технологическая Академия Конспект лекций по дисциплине «Системы искусственного интеллекта» Кафедра МПО ЭВС Осипов Г.С. 1
  • 2. Оглавление Предисловие Лекция 1. Место среди других наук, первые шаги и современные направления искусственного интеллекта 1.1. Представление знаний 1.2. Автоматизация рассуждений 1.3. Приобретение знаний, машинное обучение и автоматическое порождение гипотез 1.4. Интеллектуальный анализ данных и обработка образной информации 1.5. Многоагентные системы, динамические интеллектуальные системы и планирование 1.6. Обработка естественного языка, пользовательский интерфейс и модели пользователя 1.7. Нечеткие модели и мягкие вычисления 1.8. Разработка инструментальных средств Лекция 2. Формальные языки и формальные системы 2.1. Язык исчисления предикатов первого порядка 2.2. Исчисление предикатов первого порядка 2.3. Формальные и алгебраические системы 2.4. Интерпретация. Выводимость и истинность Лекция 3. Представление знаний. Системы, основанные на правилах, или продукционные системы 3.1. Правила для представления знаний 3.2. Рабочая память 3.3. Стратегии управления 3.4. Разрешение конфликтного множества правил 3.5. Пример Лекция 4. Представление знаний. Cемантические сети и системы фреймов 4.1. Простые и расширенные семантические сети 4.2. Универсум Эрбрана и семантические сети 4.3. Неоднородные семантические сети 4.4. Отношения структурного сходства, асоциативные и каузальные отношения 4.5. Совместность событий 4.6. Представление знаний в системах фреймов Лекция 5. Рассуждения. Автоматизация дедуктивных рассуждений 5.1. Достоверные и правдоподобные рассуждения 5.2. Автоматизация дедуктивных рассуждений. Поиск доказательств теорем методом резолюций 5.3. Метод резолюций для исчисления высказываний Лекция 6. Автоматизация дедуктивных рассуждений. Метод резолюций для исчисления предикатов первого порядка 6.1. Подстановки 6.2. Унификация 6.3. Алгоритм унификации. Примеры Лекция 7. Правдоподобные рассуждения. Автоматизация индуктивных расуждений 7.1. Понятие квазиаксиоматической теории 7.2. ДСМ -- метод индуктивного вывода Лекция 8. Правдоподобные рассуждения. Автоматизация аргументационных рассуждений и рассуждений на основе прецедентов 8.1. Аргументация 8.2. Алгоритм MIRAGE 8.3. Рассуждения на основе прецедентов Лекция 9. Методы планирования поведения. Поиск плана в пространстве состояний 9.1. Планирование как поиск доказательства теорем 2
  • 3. 9.2. Планирование в пространстве состояний Литература Лекция 1. Место среди других наук, первые шаги и современные направления искусственного интеллекта. Первые исследования, относящиеся к искусственному интеллекту были предприняты почти сразу же после появления первых вычислительных машин в начале 50-х годов 20 века. 3
  • 4. Основной целью исследований в искусственном интеллекте является получение методов, моделей и программных средств, позволяющих искусственным устройствам реализовать целенаправленное поведение и разумные рассуждения. Таким образом, научная дисциплина под названием «искусственный интеллект» входит в комплекс компьютерных наук, а создаваемые на основе её результатов технологии относятся к информационным технологиям. Особенность задач, к которым следует применять методы этой научной дисциплины, состоит в том, что в большинстве случаев, до получения результата решения задачи не известен алгоритм её решения. Алгоритмы решения таких задач являются, обычно, одним из результатов их решения. Например, алгоритм доказательства теоремы можно извлечь из её доказательства. Человек решает задачи такого рода, используя, в числе прочего, свои знания и компетентность. Это означает, что одним из важнейших направлений искусственного интеллекта является разработка механизмов переноса компетентности - обучения искусственных устройств (или, как принято говорить, приобретения знаний). При этом считается, что результаты решения задач и сам ход решения должны быть транспарентны – «прозрачны» для человека и допускать объяснение. Таким образом, важной характеристикой представления результатов и хода решения задач искусственного интеллекта является их, в значительной степени, вербальный характер. Создавая те или иные начальные компьютерные представления и модели, исследователь или разработчик сравнивает их поведение между собой и с примерами решения тех же задач специалистом в соответствующей области, модифицирует их на основе этого сравнения, пытаясь добиться лучшего соответствия результатов. Таким образом, искусственый интеллект представляет собой экспериментальную науку. Чтобы модификация программ улучшала результаты их работы, надо иметь разумные исходные представления и модели. Такие представления и модели доставляют исследования в области когнитивных наук. Впервые об искусственном интеллекте заговорили в в 1954 году, когда американский исследователь А.Ньюэлл (A.Newel) решил написать программу для игры в шахматы. Этой идеей он поделился с аналитиками корпорации «РЭНД» Дж. Шоу (J.Show) и Г.Саймоном (H.Simon), которые предложили Ньюэллу свою помощь. В качестве теоретической основы такой программы было решено использовать метод, предложенный в 1950 году Клодом Шенноном (К. Shannon), основателем теории информации. Точная 4
  • 5. формализация этого метода была выполнена Аланом Тьюрингом (Alan Turing). Он же промоделировал его вручную. В настоящее время разработка и реализация экспертных систем превратилась в инженерную дисциплину. Научные же исследования сосредоточены в ряде сформировавшихся и формирующихся направлений, некоторые из которых перечислены ниже. 1. Представление знаний. Представление знаний (knowledge representation) - одно из наиболее сформировавшихся направлений искусственного интеллекта. Традиционно к нему относилась разработка формальных языков и программных средств для отображения и описания так называемых когнитивных структур1. Сегодня к представлению знаний причисляют также исследования по дескриптивной логике, логикам пространства и времени, онтологиям. 2. Автоматизация рассуждений Автоматизация рассуждений, помимо автоматизации дедуктивных рассуждений, включает: автоматизацию индуктивных рассуждений, автоматизацию рассуждений на основе прецедентов (case-based reasoning, CBR), на основе аргументации, на основе ограничений, автоматизацию рассуждений с неопределенностью, рассуждения о действиях и изменениях, автоматизацию немонотонных рассуждений и др. Остановимся кратко на некоторых из них. Рассуждения на основе прецедентов. Здесь главные проблемы – "фокусировка поиска" на использовании прошлого опыта, оценка сходства прецедентов, поиск алгоритмов адаптации прецедентов и технологии визуализации. Пусть задано множество прецедентов как множество пар <СЛУЧАЙ, РЕШЕНИЕ>, множество зависимостей между различными атрибутами СЛУЧАЕВ и РЕШЕНИЙ, а также целевая проблема ЦЕЛЬ. Для возникающей новой ситуации («нового случая») требуется найти пару <НОВЫЙ СЛУЧАЙ, ИСКОМОЕ РЕШЕНИЕ>, которая решает целевую проблему. 1 Структур человеческого сознания, отражающих представление личности о действительности 5
  • 6. Автоматизация рассуждений на основе ограничений Наиболее интересны здесь задачи моделирования рассуждений, основанных на процедурных динамических ограничениях. Они мотивированы сложными актуальными задачами – например, планированием в реальной обстановке. Решение ищется в области значений, удовлетворяющих заданные ограничения. Под задачей удовлетворения ограничений понимается четверка множеств: множество переменных, множество соответствующих областей переменных, множество ограничений на переменные и множество отношений над областями. Решением проблемы удовлетворения ограничений называется набор значений переменных, удовлетворяющих ограничениям на переменные, такой, что при этом области, которым принадлежат эти значения, удовлетворяют отношениям над областями. Задача удовлетворения динамических ограничений есть последовательность задач удовлетворения ограничений, в которой каждая последующая задача есть ограничение предыдущей. Эти задачи по смыслу близки задачам динамического программирования. Они связаны также с интервальной алгеброй. Немонотонные рассуждения К немонотонным рассуждениям относятся исследования по логике умолчаний (default logic), по логике "отменяемых" (Defeasible) рассуждений, логике программ, теоретико - аргументационой характеризации логик с отменами, характеризации логик с отношениями предпочтения, построению эквивалентных множеств формул для логик с очерчиванием (circumscription) и некоторые другие. Такого рода модели возникают при реализации индуктивных рассуждений, например, по примерам; связаны они также с задачами машинного обучения и некоторыми иными задачами. В частности, в задачах моделирования рассуждений на основе индукции источником первоначальных гипотез служат примеры. Если некоторая гипотеза Н возникла на основе N положительных примеров (например, экспериментального характера), то никто не может дать гарантии, что в базе данных или в поле зрения алгоритма не окажется N+1 - й пример, опровергающий гипотезу (или меняющий степень ее истинности). Это означает, что ревизии должны быть подвержены и все следствия гипотезы H. Рассуждения о действиях и изменениях Большая часть работ в этой области посвящена применениям ситуационного исчисления - формализма, предложенного Джоном Маккарти в 1968 году для описания действий, рассуждений о них и эффектов действий. Для преобразования плана поведения робота в 6
  • 7. исполняемую программу, достигающую с некоторой вероятностью фиксированной цели, вводится специальное логическое исчисление, основанное на ситуационной логике. Для этой логики предложены варианты реализации на языке pGOLOG - версии языка GOLOG, содержащей средства для введения вероятностей. Активно исследуются логики действий, применение модальных логик для рассуждений о знаниях и действиях. Рассуждения с неопределенностью В основе таких рассуждений находится использование байесовского формализма в системах правил и сетевых моделях. Байесовские сети – это статистический метод обнаружения закономерностей в данных. Для этого используется первичная информация, содержащаяся либо в сетевых структурах либо в базах данных. Под сетевыми структурами понимается в этом случае множество вершин и отношений на них, задаваемое с помощью ребер. Содержательно, ребра интерпретируются как причинные связи. Всякое множество вершин Z, представляющее все пути между некоторыми двуми иными вершинами X и Y соответствует условной зависимости между этими двуми последними вершинами. Y X Z Далее задается некоторое распределение вероятностей на множестве переменных, соответствующих вершинам этого графа и полученная, но минимизированная (в некотором смысле) сеть называется байсовской сетью. На такой сети можно использовать так называемый байесовский вывод, т.е. для вычисления вероятностей следствий событий можно использовать (с некоторой натяжкой) формулы теории вероятностей. Иногда рассматриваются так называемые гибридные байесовские сети, с вершинами которых связаны как дискретные, так и непрерывные 7
  • 8. переменные. Байесовские сети часто применяются для моделирования технических систем. 3. Приобретение знаний, машинное обучение и автоматическое порождение гипотез. Работы в области приобретения знаний интеллектуальными системами были и остаются важнейшим направлением теории и практики искусственного интеллекта. Целью этих работ является создание методологий, технологий и программных средств переноса знаний и компетентности в базу знаний системы. При этом в качестве источников знаний выступают эксперты (т.е. высококвалифицированные специалисты предметных областей), тексты и данные, например, хранимые в базах данных. В соответствии с этим, развиваются различные методы приобретения знаний 4. Интеллектуальный анализ данных и обработка образной информации. Это сравнительно новое направление, основу которого составляют две процедуры: обнаружение закономерностей в исходной информации и использование обнаруженных закономерностей для предсказания (прогнозирования). Сюда относят задачи выбора информативных данных из большой их совокупности, выбора информативных характеристик некоторого объекта из более широкого множества его характеристик, задачи построения модели, позволяющие вычислять значения выбранных информативных характеристик по значениям других характеристик, и т.п. Значительную часть этого направления составляют исследования по различным аспектам распознавания изображений, в частности, с помощью нейросетей (включая псевдооптические нейросети). Изучаются методы распознавания последовательностей видеообразов на основе декларативного подхода и извлечения семантически значимой информации. К этому же направлению принадлежат исследования по графической технологии программирования в Интернете. 5. Многоагентные системы, динамические интеллектуальные системы и планирование. Это направление, изучающее интеллектуальные программные агенты и их коллективы. Основные задачи в этой области таковы: реализация переговоров интеллектуальных агентов и разработка языков для этой цели, координация поведения агентов, разработка архитектуры языка программирования агентов. Следует подчеркнуть, что со времени появления агентских технологий интерес к ним переместился из сферы академических исследований в сферу коммерческих и промышленных приложений, а идеи и методы агентских технологий 8
  • 9. весьма быстро мигрировали из искусственного интеллекта в практику разработки программного обеспечения и другие вычислительные дисциплины. С агентскими технологиями тесно связаны задачи планирования поведения, или ИИ - планирования – способность интеллектуальной системы синтезировать последовательность действий для достижения желаемого целевого состояния. Работы по созданию эффективных методов такого синтеза востребованы и активно ведутся уже около 30 лет. Планирование является основой интеллектуального управления, т. е. автоматического управления автономным целенаправленным поведением программно- технических систем.. 6. Обработка естественного языка, пользовательский интерфейс и модели пользователя. Это направление связано с разработкой систем поддержки речевого общения, c решением проблем уточнения запроса в информационных системах, с повышением точности поска, с задачами сегментации текстов по тематическим топикам, с задачами управления диалогом, с задачами анализа естественного языка, с использованием различных эвристик. Сюда же включаются проблемы дискурса (иногда под дискурсом понимают совокупность речевых актов вместе с их результатами). По прежнему актуальны задачи обучения контекстному анализу текста, задачи приобретения знаний интеллектуальными системами и извлечения информации из текстов. Важнейшей задачей в процессе извлечения информации, как, впрочем, и в процессе приобретения знаний, является минимизация роли эксперта – участника процесса. Важность этого направления нельзя недооценивать. Причина тому - возрастание потоков текстовой информации, существующий социальный заказ на поиск релевантной информации в Интернете, на анализ текстовой информации, на извлечение данных из текстов. Предметом исследований в этом направлении является также динамическое моделир пользователя, в частности, в системах электронной коммерции, адаптивный интерфейс, мониторин и анализ пользовательского поведения в Интернете. 7. Нечеткие модели и мягкие вычисления. 9
  • 10. Это направление представлено нечеткими схемами вывода, «вывода по аналогии», взглядом на теорию нечетких мер с вероятностных позиций, нечетким представлениям, аналитическими моделями для описания геометрических объектов, алгоритмами эволюционного моделирования с динамическими параметрами, такими как время жизни и размер популяции, методами решения оптимизационных задач с использованием технологий генетического поиска, гомеостатических и синергетических принципов и элементов самоорганизации. 8. Разработка инструментальных средств. Это обширная сфера деятельности, ставящая перед собой задачи: а)создания программных средств приобретения знаний для автоматизированного переноса знаний и компетентности в базы знаний. При этом в качестве источников могут выступать не только «прямые» их носители – эксперты различных областей, но и текстовые материалы – от учебников до протоколов, а также, разумеется, базы данных (имплицитные источники знаний). Вербализация, то есть перевод таких источников в эксплицитную форму составляет содержание методов обнаружения знаний в данных, в том числе различных методов обучения по примерам (включая предобработку больших массивов данных для дальнейшего анализа); б) реализации программных средств поддержки баз знаний. в) реализации программных средств поддержки проектирования интеллектуальных систем. Набор таких средств обычно содержит редактор текстов, редактор понятий, редактор концептуальных моделей, библиотеку моделей, систему приобретения знаний от экспертов, средства обучения по примерам и ряд других модулей. Лекция 2. Формальные языки и формальные системы Основным и, пожалуй, главным для человека средством описания большей части того, что ему известно, является естественный язык. Естественный язык обладает таким спектром свойств - лексической неоднозначностью, неполнотой, избыточностью, возможностью противоречивых описаний, которые, безусловно, относятся к числу его достоинств, но создают трудно преодолимые проблемы при попытках использования текстов, написанных на естественном языке в компьютерных системах. Элементарную единицу лексики языка составляет слово, имеющее в большинстве случаев не одно, а несколько значений. Любой текст на естественном языке может содержать пробелы - явно не описанные, но подразумеваемые ситуации или их фрагменты. В тексте или речи возможны повторы, которые подчеркивают наиболее 10
  • 11. существенные соображения автора, расставляют акценты. Естественный язык допускает противоречия. Более того, противоречия в языке - важный поэтический прием ("Речка движется и не движется..."). 2.1. Язык исчисления предикатов первого порядка. Основные конструкции языка L – языка исчисления предикатов первого порядка [1,2] называются формулами. Введем вначале алфавит языка L. Алфавит включает: 1. Счетное множество букв: z , y , x ,…; которое будем называть множеством символов для обозначения переменных языка; 2. Счетное множество букв a, b, c,  ; которое будем называть множеством символов для обозначения констант языка; 1. Счетное множество прописных букв P, Q,  ; для обозначения предикатных символов языка; 3. Счетное множество строчных букв f , g ,  ; для обозначения функциональных символов; 4. Символы для логических связок → (влечет), ¬ (не); 5. Символ для квантора ∀ (для любого); 7. ( , ) - скобки. Предикатные буквы P, Q, … и функциональные буквы f, g,…могут быть n – местными или, как еще говорят, n – арными. Иначе говоря, с каждым предикатным или функциональным символом будем связывать некоторое натуральное число, равное числу его аргументов. Определим понятие формулы или правильно построенного выражения языка исчисления предикатов первого порядка. Формулы языка определяются индуктивным образом. Начнем с определения терма языка: 1. Переменная есть терм. 2. Константа есть терм. 3. Если t1 ,t2 , …,tm ,…, tn - термы, а f и g – функциональные символы арности m и n, соответственно, то f (t1 ,t2 , …,tm ) и g(t1 ,t2 ,…,tn ) также термы. 4. Если t1 ,t2 , …,tm ,…, tn - термы, а P и Q – предикатные символы арности m и n, соотвественно, то P(t1 ,t2 , …,tm ) и Q(t1 ,t2 ,…,tn ) - атомарные формулы. 5. Атомарная формула есть формула. 6. Если A, B - формулы, то (A → B), ¬A , ¬B - формулы. 7. Если A – формула, то ∀xA– формула. 11
  • 12. 8. Всякое слово в алфавите языка является формулой тогда и только тогда, когда это можно показать с помощью конечного числа применений п.п. 1-7. Например, если бы мы пожелали таким образом описать язык теории групп, то следовало бы задать один двуместный функциональный символ × (умножение) и одну константу l (единицу). Предикатные символы в этом случае не понадобятся. Термами тогда были бы выражения вида × (х, у) и ×(1× (×1)). Таким образом, мы завершили одно из возможных определений языка исчисления предикатов первого порядка. Существуют и другие определения, однако, язык, определенный нами, является полным, т.е. в нем выразимо все то, что выразимо в языках (исчисления предикатов первого порядка), определенных любым иным способом. Можно, например, определить логические связки ∧,∨ (читается и и или), выразив их через связки → и ¬: 1.A∧B = ¬(A→¬B) 2. A∨ B =¬A→B Квантор существования - ∃ (существует) также выражается через квантор всеобщности и отрицание: ∃xA(x) = ¬∀x¬ A(x) Разумеется, ∧,∨ и ∃ с тем же успехом можно было бы включить в язык в качестве трех дополнительных символов. Есть, однако, некоторые преимущества в том, чтобы сохранить список символов как можно более коротким. Например, индуктивные определения и доказательства по индукции оказываются в этом случае короче. В дальнейшем нам придется использовать понятия свободного и связанного вхождения переменной в формулу. Вхождение переменной x в формулу A называется связанным, если эта переменная следует за квантором существования или всеобщности, предшествующими формуле A. В противном случае, вхождение переменной называется свободным. Если в формуле A отсутствуют свободно входящие в нее переменные (т.е. либо все переменные связаны, либо просто отсутствуют), то формула называется замкнутой формулой или предложением. Атомарную замкнутую формулу будем называть фактом. В том случае, если язык состоит только лишь из предложений, то он 12
  • 13. называется пропозициональным языком, а буквы A, B, …, входящие в формулы этого языка – пропозициональными переменными. 1.2.5. Пример. Рассмотрим иллюстративный пример, который назовем Мир кубиков. Пусть перед нами стоит задача написать программу, которая бы обеспечила разумное поведение робота - строителя башни из кубиков. Введем вначале следующие предикатные символы: On - двуместный предикатный символ “находиться на”; Em - одноместный предикатный символ “ не находиться под кубиком”; Er - находиться на земле. Тогда атомарная формула языка исчисления предикатов 1-го порядка On( x, y ) означает, что "Кубик x находится на кубике y "; атомарная формула Em(x ) означает, что "Кубик x не находится под другим кубиком"; а атомарная формула Er (x) означает, что " Кубик x стоит на земле ". Мы полагаем, что эти формулы будут использованы в качестве элементов условий, множеств добавляемых и удаляемых фактов в правилах. Но прежде чем говорить о правилах, опишем устройство рабочей памяти. Если действовать таким же образом, как было описано выше, следует задать интерпретирующее отображение I, которое каждому предикатному символу поставит в соответствие некоторое отношение на множестве кубиков. Основное множество M будет состоять из элементов, соответствующих кубикам. Итак, отображение I ставит в соответствие предикатному символу On бинарное отношение на M, предикатным символам Em и Er – одноместные отношения на M. Обозначим эти отношения так же, как соответствующие предикатные символы, только иным шрифтом. Иначе говоря, I (On) = On, I (Em) = Em, I(Er) = Er. Поскольку все отношения конечны, то их можно представить в виде таблиц (Рис. 1.2.) Элементы множества М обозначим через m1 , m2 , …, mn. On 13
  • 14. Em m1 m2 ……….. mn Er m1 m2 ……….. mn Рис.1.2.1. В начальном состоянии первая из таблиц не заполнена, а две другие заполнены полностью. Таким образом, на рис 1.2.1. изображено начальное состояние «Мира кубиков». Целевое состояние должно иметь такой вид (заметим здесь, что мы считаем все кубики идентичными и, поэтому, нумерации элементов из М не будем придавыать значения) : On m2 m1 m3 m2 …. … mn mn-1 Em mn Er m1 Рис. 1.2.2. Если мы принимаем решение использовать описания состояний, приведенные на рис. 1.2.1.и 1.2.2. в качестве рабочей памяти системы, основанной на правилах, то сами 14
  • 15. правила должны применяться к описаниям этих состояний для порождения новых состояний и такая система называется прямой системой правил. Однако, в рабочей памяти можно хранить описания целей, подцелей и т.д. Такая система правил будет называться обратной. Впрочем, различие между этими двумя системами правил можно провести лишь на интуитивном уровне. Вернемся в мир кубиков и опишем прямую систему правил для робота – строителя башен; вначале неформально. Правило первое. Если кубик находится на земле и если он не находится под другим кубиком, то выполнить следующие действия: поднять его и поставить на любой кубик, не находящийся под другим кубиком; поместить в рабочую память факты из множества добавляемых фактов и удалить факты из множества удаляемых фактов примененного правила. . Правило второе. Если кубик находится на земле и если он не находится под другим кубиком и если некоторый кубик не находится под кубиком и находится на некотором другом кубике, то выполнить следующие действия: поднять кубик, находящийся на земле и поместить его на кубик, находящийся на другом кубике; поместить в рабочую память факты из множества добавляемых фактов и удалить факты из множества удаляемых фактов примененного правила. Для решения этой задачи можно было бы построить систему и из одного правила. Однако это привело бы к серьёзному усложнению этого правила и увеличению вычислительных трудностей на этапе исполнения. Кроме того, трудно было бы продемонстрировать возможности стратегии управления. Перейдем к уточнению вида правил для решения этой задачи. Обозначим правила через П1 и П2, т.е. П1 = <С1 , A1, D1 > , где . С1= { Em( y ) , Er ( y ) , Er (x) }, A1= {On (x, y)}, D1= { Em( y ) , Er (x) }. П2 = <С2 , A2, D2 >, где С2= { Em(x) , Er (x) , Em( y ) , On (y, z) }, 15
  • 16. A2= {On (x, y)}, D2= { Er (x) , Em( y ) }. Стратегия управления, которая потребуется для решения этой задачи, описана в п 1.2.3 . Напомним её: Шаг 1. Выбрать очередное правило из множества правил; Шаг 2. Проверить выполнимость условия правила в текущем состоянии рабочей памяти; Шаг 3. Если условие правила выполнено, поместить правило в конфликтное множество; Шаг 4. Если множество применимых правил исчерпано, выбрать какое- либо правило из конфликтного множества правил и применить его. Шаг 5. Перейти к шагу 1. В нашем примере к начальному состоянию применимо лишь первое правило (т.к. в начальном состоянии таблица On пуста и, следовательно, формула On(x,y) невыполнима), поэтому в начальном состоянии конфликтное множество состоит из одного лишь правила и проблемы выбора не возникает. При установлении выполнимости формул Em( y ) , Er ( y ) Er (x ) , в условия первого правила вместо свободных переменных в формулы условия будут подставлены значения (например, m1 вместо y и m2 вместо x). Соответствующие подстановки будут выполнены также в формулы из множеств А и D. Атомарные формулы из множеств А и D превратятся в формулы без свободных переменных, т.е. в добавляемые и удаляемые факты, а именно, формулы On (x, y) из множества добавляемых фактов и Em(y) и Er(x) из множества удаляемых фактов примут вид On (m2, m1) , Em(m1), Er(m2), соответственно. Применение правила состоит в том, что первая пара, т.е. (m2, m1 ) будет помещена в таблицу On, а значения переменных из второй и третьей формул, т.е. m1 и m2, соответственно,– удалены из таблиц Em и Er. Таким образом, мир кубиков будет модифицирован и в рабочей памяти появится описание второго состояния. 16
  • 17. К этому, второму состоянию оказываются применимы оба правила. Т.к. множество применимых правил будет теперь состоять из двух правил, то необходимо уточнить шаг 4 стратегии управления, т.е. значение слов «какое – либо правило». Если попытаться промоделировать стратегию управления «вручную», то нетрудно убедиться, что на втором шаге следует применить второе правило. Чтобы обеспечить строительство одной башни (а не нескольких), второе же правило следует применять и на всех последующих шагах. Второе правил отличается от первого большим количеством атомарных формул в условии. Таким образом, возникает следующий эмпирический принцип выбора: всякий раз, когда к некоторому состоянию применимо более одного правила, должно выбираться правило, более точно учитывающее особенности текущего состояния; таким правилом, очевидно, является то правило, условие которого более детально описывает состояние. Поскольку степень детальности описания состояния определяется количеством атомарных формул в условии правила, то стратегия разрешения конфликтного множества, которую следует здесь применить, имеет в своей основе следующую эвристику: “Выбрать из множества применимых правил то правило, условие которого содержит наибольшее число различных атомарных формул». Именно так следует в данном случае модифицировать шаг 4 стратегии управления. Применение сформулированной эвристики приведет к выбору второго правила и на всех последующих шагах. Процесс завершится либо по исчерпании применимых правил, либо по достижении целевого состояния. К системам правил мы бдем возвращаться и в дальнейшем; им будет уделено достаточно много места в четвертой главе; пока же рассмотрим иной способ представления знаний, называемый семантическими сетями. Лекция 3. Представление знаний. Системы, основанные на правилах или продукционные системы. Если рассматривать многие интеллектуальные системы, то на самом высоком уровне их описания можно выделить следующие компоненты: рабочую память (или, как иногда говорят, глобальную базу данных), множество правил, выполняющих некоторые действия (во внешней среде и в рабочей памяти) и некоторую стратегию управления, в соответствии с которой происходит выбор правил для применения и выполнение действий. 17
  • 18. Правила применяются к рабочей памяти. В состав каждого правила входит некоторое условие, которому текущее состояние рабочей памяти может удовлетворять, либо нет. Правило может быть применено, если условие выполнено. Применение правила изменяет состояние рабочей памяти. Стратегия управления выбирает, какое именно правило из числа применимых следует использовать и прекращает вычисления, когда состояние рабочей памяти удовлетворяет целевому условию. С точки зрения архитектуры такой подход обладает следующими существенными отличиями от архитектур традиционных программных систем: - рабочая память доступна всем правилам; - отсутствуют вызовы правил из других правил; - отсутствует априорно заданный алгоритм решения задачи (т.е. порядок выполнения правил) – алгоритм решения задачи является одним из результатов её решения; - данные и результаты вычислений становятся доступными правилам только через рабочую память. Особенности организации систем, основанных на правилах, как легко видеть, обеспечивают, в значительной степени, модульный их характер и изменения в рабочей памяти, множестве правил или в стратегии управления могут проводиться относительно независимо. Эти свойства систем, основанных на правилах, хорошо согласуются с эволюционным характером разработки больших программных систем, предполагающих использование значительных объемов знаний. Перейдем теперь к более детальному изложению основных идей систем, основанных на правилах, следуя, главным образом, работам [4,5]. 3.1.Правила для представления знаний. Определение 3.1. Правилом называется упорядоченная тройка множеств П = C , A, D , где 18
  • 19. С – условие правила; А – множество добавляемых правилом фактов; D -множество удаляемых правилом фактов. Как и было обещано в начале главы, для записи элементов основных конструкций языка представления знаний (в данном случае, языка правил), т.е. условия C правила П, множеств A и D будем (хотя это не обязательно) использовать язык исчисления предикатов первого порядка. А именно, будем полагать, что каждое из упомянутых множеств есть множество атомарных формул языка исчисления предикатов первого порядка. Напомним здесь, что в предыдущей лекции фактами были названы атомарные формулы исчисления предикатов первого порядка без свободных переменных. В связи с этим, будем считать, что в правилах атомарные формулы из множеств С, А и D превращаются в факты в процессе применения правила, т.е. в результате выполнения соответствующих подстановок (m1 , m2 ,…, mn ) на места свободных переменных (x1 ,x2 , …,xn ) и проверки для каждой формулы P(x1 ,x2 ,…,xn ) из С условия (m1 , m2 ,…, mn ) ∈ I(P), т.е. выполнимости в текущем состоянии рабочей памяти. Определение 3.2. Будем говорить, что условие правила выполнено, если в текущем состоянии рабочей памяти истинна каждая из атомарных формул условия. Определение 3.3. Правило применимо к состоянию рабочей памяти, если его условие выполнено в этом состоянии. 3.2.Рабочая память. Рабочая память должна быть согласована с множеством правил. Согласование выполняется следующим образом: пусть П – некоторое множество правил; С, A и D – объединения условий, множеств добавляемых фактов и множеств удаляемых фактов по всему множеству П. М- множество индивидов предметной области. Тогда для каждой n – местной атомарной формулы P (x, y, …, z) ∈ С ∪ A ∪ D рабочая память должна содержать n – местное конечное отношение I (P) ⊆ Mn , где I – интерпретирующее отображение (Рис.1.2.) P ( x ), P2 ( y , z ), P ( x, y , v ) 3 1 R1 R2 R3 19
  • 20. Рис. 1.2. (Стрелками показано отображение I ) Таким образом, рабочая память должна содержать множество конечных отношений или таблиц, каждая из которых является интерпретацией одного из предикатных символов, входящего в объединенное множество условий, списка добавляемых или удаляемых фактов. Заметим здесь, что правило можно рассматривать как действие или команду исполнительному органу, которая может разворачиваться в последовательность действий. Добавляемые и удаляемые правилом факты называются эффектом действия и выполняют модификацию модели мира, т.е. формируют в рабочей памяти системы отражение тех изменений в мире, которые произошли после выполнения действий, предписанных правилом. Правила могут, также, рассматриваться как средство пополнения знаний о мире, например, в результате обучения. 3.3. Стратегии управления Стратегии управления предназначены для организации процесса вычислений. В самом общем виде стратегию управлеия можно описать следующим образом: Шаг 1. Выбрать очередное правило из множества правил; Шаг 2. Проверить выполнимость условия правила в текущем состоянии рабочей памяти; Шаг 3. Если условие правила выполнено, поместить правило в конфликтное множество; Шаг 4. Если множество применимых правил исчерпано, выбрать какое-либо правило из конфликтного множества правил и применить его. Шаг 5. Перейти к шагу 1. Условиями остановки являются пустое конфликтное множество, либо достижение целевого состояния. 20
  • 21. Приведенная стратегия порождает недетерминированный процесс, поскольку она не устанавливает, каким образом следует выбирать правило из множества применимых правил. В большинстве случаев информации, доступной стратегии управления, недостаточно для точного решения задачи выбора. Поэтому работу систем, основанных на правилах, можно охарактеризовать как процесс поиска, при котором правила подвергаются испытанию до тех пор, пока не обнаружится, что некоторая их последовательность порождает состояние рабочей памяти, удовлетворяющее целевому условию. При этом часто используются различные эвристики, сокращающие перебор. (Эвристикой будем называть правило выбора без достаточных теоретических оснований). Вид эвристики обычно диктуется условиями задачи. Позже мы обсудим различные эвристики, а пока уточним, что стоит за словами «Проверить выполнимость условия правила» и «Применить правило». В п.3.2. было установлено соответствие между множеством атомарных формул условий, множеств добавляемых и удаляемых фактов из правил и множеством отношений рабочей памяти. Проверка выполнимости условия выбранного правила состоит в том, в каждую атомарную формулу P (x, y, …, z) условия подставляются значения из текущего состояния рабочей памяти, а именно из таблицы, соответствующей P (x, y, …, z) в смысле отображения I. При этом обычно известно и соответствие столбцов таблицы I (Р) сортам аргументов формулы P (x, y, …, z) (в многосортном языке). Если существует подстановка σ = (m1 , m2 , …, mn ), такая что σ ∈ I (Р), то формула P (x, y, …, z) условия выполняется на ней или, иначе говоря, выполняется в текущем состоянии рабочей памяти. Если существуют подстановки σ1, σ2, …, σk , такие что на местах одноименных свободных переменных всех формул условия оказываются одни и то же значения (подставленные из соответствующих таблиц) и при этом все формулы условия оказываются выполнены, то условие правила выполнено в текущем состоянии рабочей памяти. Что касается применения правила, оно состоит в том, что в текущее состояние рабочей памяти добавляются факты из множества добавляемых фактов правила и удаляются факты из множества удаляемых фактов. 21
  • 22. Происходит это следующим образом. Если установлена выполнимость условия некоторого правила, свободные переменные в формулах условия, как было сказано выше, приобретают значения из записей текущего состояния рабочей памяти. При этом происходят и замены свободных переменных в формулах из множеств AиD теми значениями, которые были подставлены на места одноименных свободных переменных в формулы условия. Для тех формул из множества A, которые в результате этого процесса превратились в факты, значения, находящиеся на местах свободных переменных, дописываются в таблицы, соответствующие этим формулам в смысле отображения I, для формул же из множества D, которые также в результате этого процесса превратились в факты, значения, находящиеся на местах свободных переменных, удаляются из таблиц, соответствующих этим фактам в смысле отображения I. В дальнейшем тройку: множество правил + рабочая память + стратегия управления будем называть системой, основанной на правилах. Состоянием системы, основанной на правилах, будем называть состояние рабочей памяти вместе с множеством применимых правил. Системы, основанные на правилах, являются важным классом систем, основанных на знаниях. Лекция 4. Представление знаний. Cемантические сети и системы фреймов. Семантические сети наряду с системами правил являются весьма распространенным способом представления знаний в интеллектуальных системах. Особое значение этот способ представления знаний приобретает в связи с развитием сети интернет. Кроме ряда особенностей, позволяющих применять семантические сети в тех случаях, когда системы правил не применимы, семантические сети обладают следующим важным свойством: они дают возможность соединения в одном представлении синтаксиса и семантики или синтаксического и семантического аспекта описаний знаний предметной области. Происходит это благодаря тому, что в семантических сетях наряду с переменными для обозначения тех или иных объектов (элементов множеств, некоторых конструкций из них) присутствуют и сами эти элементы и конструкции; присутствуют и связи, сопоставляющие тем или иным переменным множества допустимых интерпретаций. Эти обстоятельства позволяют во многих случаях резко уменьшить реальную вычислительную сложность решаемых задач. 22
  • 23. 4.1. Простые и расширенные семантические сети. Понятие семантической сети возникло в 1966 г. году в работах М.Р.Квиллиана [7] при попытке описания семантики глагола с помощью графа специального вида. Это описание было составлено из вершин, в которых находились лексические единицы анализируемого предложения и «ассоциативных» дуг, служащих для описания ссылок одних вершин на другие. Для таких описаний М.Р. Квиллиан ввел термин «семантическая память». Каждой вершине в семантической памяти соответствовала некоторая «страница», содержащая определение соответствующего вершине понятия. Каждый из указателей относился к одному из следующих типов: подкласс, дизъюнкция, конъюнкция, свойство, субъект. Такие структуры обладали некоторыми дедуктивными свойствами, порождаемыми отношениями «подкласс» и «свойство». Один из механизмов вывода в семантической сети Квиллиана состоял в распространении активности и поиске по пересечению. Пути от начальных вершин к общей вершине определяют некоторое отношение между двумя лексическими единицами. Иначе говоря, речь шла об обнаружении неявно (имплицитно) заданной информации для дальнейшего ее использования в интеллектуальной системе. Роберт Ковальский из Эдинбурга в 1979 г. [8] ввел понятия простых и расширенных семантических сетей, использовав клаузальную логику для их определения. Для рассмотрения семантических сетей такого вида вернемся к языку исчисления предикатов первого порядка, а именно, к его клаузальной форме. Клауза есть выражение вида B1 , B2 ,..., Bm ← A1,...,An где B1 , B2 ,..., Bm суть атомарные формулы, n≥0 и m≥0. Атомарные формулы A1,...,An суть совместные посылки клаузы, а B1 , B2 ,..., Bm суть альтернативные заключения. (Множество клауз совместно, если оно истинно в одной из моделей языка). Если клауза содержит переменные x1, x2,…,xk, то она соответствует формуле с квантором всеобщности: ∀x1, ∀x2 ,…, ∀xk (B1 ∨ B2 ∨... ∨ Bm, если A1^,…,^ An.) Если n=0, то клаузу следует интерпретировать так: ∀ x1, ∀x2,…, ∀xk, (B1 ∨ B2 ∨... ∨ Bm.). Если m=0, то интерпретация такова: ¬∃ x1, ¬∃x2,…, ¬∃xk A1^,…,^ An. Если n=m=0 то клауза является тождественно ложным высказыванием и записывается . Если клауза содержит не более одной атомарной формулы в заключении, т.е.m≤1, то клауза называется клаузой Хорна или Хорновской клаузой. 23
  • 24. Простая семантическая сеть может рассматриваться как форма записи утверждений клаузальной логики без свободных переменных. Например, клауза P(a,b) ← в языке простых семантических сетей изображается как дуга, помеченная меткой P и направленная из a в b: a P b рис.1.3.1. В расширенных семантических сетях, как и в простых, вершины сопоставляются индивидам, а ребра – бинарным отношениям. Однако, вершины в расширенных семантических сетях могут соответствовать константным символам, переменным или термам, содержащим функциональные символы. Атомарные формулы, соответствующие условиям клауз описываются с помощью двойных дуг, а заключения - одинарных. Клаузы, содержащие более одной атомарной формулы, можно выделять как подсети. Например, расширенная семантическая сеть на рис.1.3.2. нравится Мэри X нравится нравится Боб Джон логика Является нравится нравится Человек у Рис.1.3.2. соответствует множеству клауз: Джону нравится Мери ← Джон является человеком← Мери нравится Джон, Мери нравится Боб←Мери нравится x 24
  • 25. Бобу нравится y←y нравится логика Наклонная прямая отделяет подсеть, содержащую условия (левая верхняя полуплоскость) от подсети заключений. Помимо изобразительных возможностей, семантические сети обладают более серьезными достоинствами. То обстоятельство, что вся информация об индивиде представлена в единственном месте – в одной вершине, означает, что вся эта информация непосредственно доступна в этой вершине, что, в свою очередь сокращает время поиска, в частности, при выполнении унификации и подстановки в задачах логического вывода. Существует еще одна, более тонкая особенность расширенных семантических сетей – они позволяют интегрировать в одном представлении синтаксис и семантику (т.е. интерпретацию) клаузальных форм. Это позволяет в процессе вывода обеспечивать взаимодействие синтаксических и семантических, теоретико-модельных подходов, что, в свою очередь, также является фактором, зачастую делающим вывод более эффективным. 4.2. Универсум Эрбрана и семантические сети. Здесь мы развернем тезис, сформулированный в последнем абзаце предыдущего раздела. Пусть задано некоторое множество клауз. Попытаемся «экономным» способом построить для него модель. Это означает, что следует выбрать некоторый универсум и указать соответствие между константами и иными конструкциями языка и объектами этого универсума и конструкциями из них. Следуя принципу экономии, мы не будем вводить специальных имен для элементов модели, поэтому выберем в качестве универсума такое множество, которое включает все константы, встречающиеся в множестве клауз и все термы, построенные из них с помощью функциональных символов, встречающихся в множестве клауз. Такое множество называется универсумом Эрбрана. Иначе говоря, интерпретация I есть в данном случае тождественное отображение из множества термов в себя. Далее, доведя принцип экономии до предела, мы используем n – местные предикатные символы, встречающиеся в клаузах, для обозначения соответствующих им при отображении I n – арных отношений над элементами универсума. Рассмотрим простой пример. 25
  • 26. Пусть задано множество клауз. Всякий человек, который является хозяином собак, не является хозяином кошек. Джон является хозяином Линды Петя является хозяином Мурки Введем бинарные предикатные символы P – быть хозяином и Q – не быть хозяином. Тогда клаузальная форма этих утверждений имеет следующий вид: Q(человек, кошка) ←P(человек, собака) P(Джон, Линда) ← P(Петя,Мурка) ←. Для полноты картины введем еще один предикатный символ, означающий принадлежность экземпляра (примера) общему понятию. В теории интеллектуальных систем его принято обозначать ISA (“is a” - третье лицо единственного числа английского глагола to be): ISA (Джон, человек) ← ISA (Петя, человек) ← ISA (Линда, собака) ← ISA (Мурка, кошка) (Иногда этот предикатный символ используется в инфиксной нотации, например, «Джон ISA человек», но это не имеет существенного значения). Представим теперь описанную ситуацию в виде расширенной семантической сети (рис.1.3.3). Петя Линда Джон Мурка Собака Человек Кошка Рис.1.3.3. 26
  • 27. На рис. 1.3.3. каждому предикатному символу соответствует свой тип линии, а именно: P- ISA - Q- Направление стрелки указывает порядок следования аргументов в формуле. Если сопоставить этот рисунок со сказанным об универсуме Эрбрана, то легко видеть, что закрашенные вершины соответствуют элементам, а пары (Петя, Мурка), (Джон, Линда) – элементам отношений универсума Эрбрана, а именно – отношению P. Что касается пар (Мурка, кошка), (Линда, собака) (Петя, человек) и (Джон, человек), принадлежащих отношению ISA, то они связывают синтаксис с семантикой или синтаксические элементы “Кошка”, “Собака” и “Человек”, являющиеся именами общих понятий, с примерами этих понятий. Оставив более детальное изучение полезных свойств универсума Эрбрана для последующих глав, используем нотацию расширенных семантических сетей для ответа на вопрос “Является ли Джон хозяином Мурки?” Для решения этой задачи вначале совместим пары закрашенных вершин с парами незакрашеных по ISA ребрам, при этом метка ребра пары закрашенных вершин должна совпадать с меткой ребра пары незакрашенных вершин. Затем проделаем такую же операцию с интересующими нас целевыми вершинами (т.е. совместим их с не закрашенными вершинами по ISA – связям) в результате чего немедленно получим, что Джон не является хозяином Мурки. Этот простой пример есть пример вывода на расширенной семантической сети. 27
  • 28. В 1986 году В.Н. Вагиным [9] были предложены раскрашенные семантические сети. В отличие от расширенных семантических сетей, в раскрашеных семантических сетях вершины соответствуют клаузам, их условиям, заключениям и предикатным символам, в них входящим, а ребра, связывают условия и заключения клауз с вершинами, соответствующими клаузам. Далее, атомарные формулы, входящие в условия и заключения соединяются ребрами с вершинами, соответствующими условиям и заключениям и, наконец, индивидные символы соединяются ребрами с вершинами, соответствующими атомарным формулам. Кроме того, введены специальные правила раскраски семантических сетей. Они таковы: для каждой клаузы A ← B условие и заключение “раскрашиваются” различными цветами. Это правило распространяется также на тот случай, когда как условие, так и заключение состоят более чем из одной атомарной формулы. Раскрашенные сети позволяют более эффективно, чем предыдущие представления, организовать процесс параллельной дедукции. Более подробную информацию о них можно почерпнуть из литературы, указанной в конце книги. В 1987 году автор этих строк [10] ввел понятие неоднородных семантических сетей. Приведем краткое описание этого способа представления знаний. 4.3. Неоднородные семантические сети. Неоднородная семантическая сеть (НСС) – семейство графов, имеющих общее множество вершин; вершинам сопоставлены объекты моделируемой действительности, ребрам - элементы некоторых бинарных отношений на множестве вершин; ребрам же сопоставлены процедуры, предназначенные для проверки корректности сети и порождения различного рода гипотез, повышающих эффективность процесса построения сети. Подробнее о роли таких процедур будет сказано в главе, посвященной приобретению знаний. НСС предназначены для описания, главным образом, таких областей, которые можно отнести к плохо структурированным, т.е. областей, для которых не известен полный набор свойств их индивидов, не полностью известна структура самих индивидов, а знания об индивидах и их взаимосвязях и зависимостях не имеют «готового», завершенного вида, такого, например, который описывается с помощью правил. При этом предполагается, что те связи и зависимости, которые удается, всё же, установить, носят локальный характер. . Определение 1.3.1. Неоднородной семантической сетью будем называть алгебраическую систему 28
  • 29. H=<D, N, R, F> , где D={ D1, D2,..., Dn} - семейство непустых множеств; N ⊆ N – выделенное подмножество множества слов конечной длины над некоторым алфавитом; R - семейство бинарных отношений R1, R2,...,Rq на N2; Ri⊆ N2 ; i∈{1, 2, …, q}. F ={f1,f2,...,fm} семейство функций, каждой из которых приписан некоторый тип. А именно, функция fi (i∈{1,2, …, m}) имеет тип <τ, ω> , где τ = <k1, k2, …, km> если она определена на декартовом произведении D k1 x D k2 x ... x D km , а областью её значений является множество Dω , так что каждому кортежу δ ∈ D k1 x D k2 x ... x D km функция f i типa <τ, ω> из F ставит в соответствие некоторый элемент f(δ) из Dω. То обстоятельство, что fi имеет тип <τ, ω> будем обозначать <τ, ω> (fi). Неоднородную семантическую сеть, определенную таким образом, будем называть интенсиональной семантической сетью. Лекция 5. Рассуждения. Автоматизация дедуктивных рассуждений. Вначале приведём краткую характеристику основных процедур рассуждений, таких как дедукция, индукция, аналогия, рассуждения на основе прецедентов, абдукция и аргументация. Затем более детально рассмотрим методы автоматизации некоторых из названных типов рассуждений в вычислительных системах. Начнем с дедуктивных рассуждений. Дедуктивное рассуждение - это последовательность дедуктивных умозаключений. Дедуктивным называют такое умозаключение, в котором из знания большей степени общности выводится знание меньшей степени общности. Первые точные схемы дедуктивных умозаключений принадлежат Аристотелю (384-322 г.г. до нашей эры). Эти схемы носят название силлогизмов. К числу основных силлогизмов Аристотеля относятся категорический силлогизм, условный силлогизм, разделительный силлогизм, условно- разделительный силлогизм; сокращенные, сложные и сложносокращенные силлогизмы или энтимемы. Каждый из силлогизмов имеет несколько разновидностей, отличающихся друг от друга количеством и качеством посылок и называемых модусами. Связано такое разделение с тем, что все суждения по своему качеству делятся на четыре вида: 29